• Sobre elDinero
  • Contacto
  • Anúnciese
Hemeroteca
Versión Impresa
elDinero Mujer
Foro Económico
Periódico elDinero
Sin resultados
Ver todos los resultados
  • Finanzas
    • Banca
    • Mercado de valores
    • Finanzas personales
  • Energía
  • Industria
    • Comercio
  • Agricultura
  • Turismo
  • Global
  • Opiniones
    • Editorial
    • Cartas al Director
    • Ojo pelao
    • Observaciones
  • elDinero Mujer
  • MÁS
    • Reportajes
    • Comercio
    • Actividades
    • Cine financiero
    • Entrevista
    • Desayuno Financiero
    • Laboral
    • Tecnología
    • ¿Quiénes compiten?
Sin resultados
Ver todos los resultados
Periódico elDinero
  • Finanzas
    • Banca
    • Mercado de valores
    • Finanzas personales
  • Energía
  • Industria
    • Comercio
  • Agricultura
  • Turismo
  • Global
  • Opiniones
    • Editorial
    • Cartas al Director
    • Ojo pelao
    • Observaciones
  • elDinero Mujer
  • MÁS
    • Reportajes
    • Comercio
    • Actividades
    • Cine financiero
    • Entrevista
    • Desayuno Financiero
    • Laboral
    • Tecnología
    • ¿Quiénes compiten?
Sin resultados
Ver todos los resultados
Periódico elDinero
Sin resultados
Ver todos los resultados

Amazon presenta BASE TTS, el modelo de conversión de texto a voz “más grande hasta la fecha” con resultados realistas

Europa PressPorEuropa Press
15 February, 2024
en Tecnología
Los investigadores trasladaron esta idea a los modelos de conversión de texto a voz para conseguir un resultado de voz más natural. Fuente externa.

Los investigadores trasladaron esta idea a los modelos de conversión de texto a voz para conseguir un resultado de voz más natural. Fuente externa.

WhatsappFacebookTwitterTelegram

Amazon ha presentado el modelo de conversión de texto a voz denominado Big Adaptative Streamable TTS (BASE TTS), el “más grande hasta la fecha” de su estilo, que ha sido entrenado con hasta 100,000 horas de audio de dominio público para obtener capacidades de habla más realistas.

La compañía tecnológica ha investigado formas de mejorar las capacidades de los modelos de conversión de texto a voz, de cara a obtener resultados de audio más realistas y naturales, capaces de imitar cuestiones más complejas en el habla, como las emociones, las frases complejas, las palabras extranjeras o la interpretación de los signos de puntuación.

En este marco, Amazon ha presentado BASE TTS, el modelo de conversión de texto a voz “más grande hasta la fecha”, que ha sido entrenado con 100,000 horas de datos de voz de dominio público y 980 millones parámetros en su variante más avanzada, para mejorar su capacidad para pronunciar palabras y oraciones de forma natural, incluso con una entonación compleja.

En concreto, tal y como ha explicado la compañía en un comunicado, se trata de un modelo que utiliza un transformador de prácticamente mil millones de parámetros que convierte textos sin formato en códigos de voz, que ha combinado con un decodificador que convierte códigos de voz en formas de onda. Como resultado, BASE TTS funciona con una arquitectura “simplificada y altamente eficiente” que, según Amazon, se completa con una “novedosa” técnica de tokenización de voz.

Para encontrar una forma de obtener resultados de voz más realistas, los investigadores de Amazon han tomado como ejemplo las “habilidades emergentes” que ofrecen los grandes modelos de lenguaje (LLM) cuando se entrenan con un volumen cada vez mayor de datos, que comienzan a mostrar comportamientos de aprendizaje y resultados mejores exponencialmente.

En este sentido, los investigadores trasladaron esta idea a los modelos de conversión de texto a voz para conseguir un resultado de voz más natural y comprobar cómo evoluciona el comportamiento del modelo, en base al entrenamiento recibido. Para ello, desde Amazon han entrenado BASE TTS con varias variantes.

Tal y como ha detallado la compañía en un artículo sobre el estudio, se ha probado con una variante de BASE TTS pequeña, entrenada con 1.000 horas de datos de audio y 150 millones de parámetros; una variante median, con 10,000 horas de audio de entrenamiento y 400 millones de parámetros; y la variante más grande, con 100,000 horas de entrenamiento de audio y 980 millones de parámetros.

Concretamente, los datos de audio utilizados para el entrenamiento incluían un 90 por ciento de audio en inglés. Igualmente, también se han incluido datos en alemán, holandés y español.

En este marco, los investigadores comprobaron que a partir de la variante mediana del modelo, se comenzó a mostrar una comprensión más avanzada de los textos y una pronunciación y fonética “contextualmente apropiada”.

Con todo ello, el modelo BASE TTS es capaz de ofrecer mejores resultados gracias a las “habilidades emergentes” que proporciona el entrenamiento de datos. En concreto, muestra mejoras en frases con sustantivos compuestos, que muestren emociones o que utilicen palabras extranjeras.

Tal y como ha detallado Amazon, el modelo también es capaz de reproducir palabras paralingüísticas -es decir, sonidos-, interpretar de forma correcta los elementos de puntuación, incluidas las preguntas y otras complejidades sintácticas.

Archivado en: AmazonBASE TTS
Publicación anterior

Las peticiones semanales de subsidio por desempleo en EEUU caen hasta las 212,000 solicitudes

Siguiente publicación

Wall Street abre en terreno mixto y el Dow Jones sube un 0.15%

Europa Press

Europa Press

Agencia de noticias y actualidad de España y del mundo. Política, economía, deportes, cultura, ciencia, ocio y sociedad.

Otros lectores también leyeron...

Meta refuerza su infraestructura de IA mediante acuerdos con grandes proveedores tecnológicos.

Meta acuerda con Amazon el uso de chips Graviton para impulsar su inteligencia artificial

Amazon se convirtió en septiembre de 2018 en la segunda empresa estadounidense en alcanzar el billón de dólares, solo por detrás de Apple.

Amazon destrona a Walmart y se convierte por primera vez en la compañía con mayores ingresos anuales

Amazon nunca llegó a chocar de frente con Mercado Libre pero pretende cambiar eso.

Amazon amenaza el liderazgo de Mercado Libre en Brasil

Amazon se ha reunido con ejecutivos editoriales para debatir sobre la creación de este tipo de mercado.

Amazon planea crear un mercado de contenidos de medios para que las empresas de IA puedan adquirirlos

Amazon está intentando mantener "los precios lo más bajo posible" para que los consumidores no lo sufran.

Amazon advierte que los aranceles de Trump ya se notan en los precios de ciertos productos

BPI advierte de que el aumento del peso de la industria tecnológica en la capitalización de mercado general "magnifica los riesgos de contagio".

Aumenta preocupación en los mercados por las sobrevaloraciones de la IA, según el BPI

Siguiente publicación
Wall Street. | Richard Drew; AP.

Wall Street abre en terreno mixto y el Dow Jones sube un 0.15%

Deje un comentario

Últimas noticias

Gobierno anuncia RD$800 millones más al subsidio sector transporte para evitar aumentos al pasaje 

5 May, 2026
Marco Rubio abordará en el Vaticano la guerra en Irán y la situación en Latinoamérica.

Rubio tratará con el papa León XIV la guerra de Irán y América Latina en su visita al Vaticano

5 May, 2026
Trabajadores del sector social y sanitario, clave en el crecimiento del empleo mundial.

La OIT prevé que la demanda de trabajadores de cuidados se duplicará en Latinoamérica hacia 2050

5 May, 2026
Operadores financieros siguen la evolución de los mercados en medio de la incertidumbre global.

Wall Street abre en verde con incertidumbre sobre el tránsito de buques en Ormuz

5 May, 2026
Biviana Riveiro destaca el crecimiento de la inversión extranjera y la confianza en la economía dominicana.

RD consolida su liderazgo regional en inversión extranjera directa con crecimiento sostenido

5 May, 2026

Periodismo económico y financiero responsable

EDITORIAL CM, SAS
Edificio Corporativo MARTÍ
Rafael Augusto Sánchez, esquina Winston Churchill,
Ensanche Piantini, Santo Domingo, RD.

Newsletter

  • Sobre elDinero
  • Hacemos esto…
  • Contacto

© 2015 - 2025 Periódico elDinero - Todos los derechos reservados.

Sin resultados
Ver todos los resultados
  • Finanzas
    • Banca
    • Mercado de Valores
    • Finanzas personales
  • Energía
  • Industria
  • Agricultura
  • Turismo
  • Mercado global
  • Opiniones
  • elDinero Mujer
  • Contacto
  • Versión impresa
  • Newsletter

© 2015 - 2025 Periódico elDinero - Todos los derechos reservados.

VERSIÓN IMPRESA

Hojee y descargue nuestra versión impresa y disfrute del contenido más relevante y mejor trabajado sobre economía y finanzas

Versión impresa #535