Mozilla, 2017 yılında "Common Voice" adını verdiği bir proje başlatmıştı. Bu proje kapsamında dünyanın dört bir yanından gönüllülerin ses kayıtları toplanmıştı. Projenin amacı ise küresel olarak kullanılabilecek, ses tanıma yapay zekâ araçlarının eğitilmesini sağlayacak eğitim setleri oluşturmaktı. Proje kapsamında bugüne kadar 180 dilde 30 bin saatlik konuşma verisi toplanmıştı.
Mozilla bu veriyi kimin kullandığına dair çok fazla bilgiye sahip değil, zaten ses dosyaları da kamuya açık kaynak konumunda bulunuyor. Öte yandan firmadan gelen açıklamalara göre bu verileri kullananlar arasında büyük teknoloji firmaları, küçük bağımsız geliştiriciler ve farklı projelerde çalışan ekipler yer alıyor.
Her yerde Mozilla'nın topladığı sesler kullanılıyor