Google USM (Universal Speech Model)

O modelo de fala de última geração do Google que suporta mais de 300 idiomas. Confira mais sobre o Universal Speech Model

Google USM (Universal Speech Model)

O USM (Universal Speech Model) é um modelo de fala desenvolvido pela equipe de pesquisa do Google que tem como objetivo suportar mais de 1.000 idiomas. É um modelo de fala de última geração com 2 bilhões de parâmetros treinados em 12 milhões de horas de fala e 28 bilhões de frases de texto, abrangendo mais de 300 idiomas. O USM pode realizar reconhecimento automático de fala (ASR) não apenas em idiomas amplamente falados como inglês e mandarim, mas também em idiomas com poucos recursos como amárico, cebuano, assamês e azerbaijano, para citar alguns.

O USM é um passo crítico em direção ao suporte de 1.000 idiomas. Ele foi criado como parte da Iniciativa de 1.000 Idiomas do Google, um compromisso ambicioso de construir um modelo de aprendizado de máquina que suportasse os mil idiomas mais falados do mundo, trazendo maior inclusão para bilhões de pessoas em todo o mundo .

Em breve o Google tornará o USM disponível via API, é possível que eles também tragam mais informações a respeito do modelo ainda hoje, 10 de maio no Google I/O 2023