Home Tecnología ¿Qué es la tecnología de procesamiento de voz de Inteligencia Artificial? – Tienda.Digital

¿Qué es la tecnología de procesamiento de voz de Inteligencia Artificial? – Tienda.Digital

por Redacción BL
0 comentario
¿Qué es la tecnología de procesamiento de voz de Inteligencia Artificial? – Tienda.Digital


Recientemente se habló sobre los electrodomésticos IoT que pueden operar aires acondicionados y similares mientras están afuera. Lo mejor de todo es el altavoz inteligente, ¿no? Las principales empresas como Google, Amazon, Line y Apple están lanzando modelos que se especializan en funciones que son compatibles con sus servicios. Introduciremos el mecanismo del servicio que le permite realizar varias operaciones con solo hablar.


¿Qué es el procesamiento de voz con IA?

Primero, presentemos el procesamiento de voz y el reconocimiento de voz que son la base de la tecnología.

Los humanos pueden entender las palabras que escuchan y responderlas tal como son, pero las computadoras no pueden hacer eso, por lo que los datos de voz que las personas hablan se aplican al sistema informático y se convierten en datos de texto. Sin embargo, al comprender los datos de texto, puede reaccionar solo por primera vez. Esta serie de procesos se llama tecnología de procesamiento de voz / reconocimiento de voz.

Mecanismo de procesamiento de voz.

En el procesamiento del habla, el sonido se procesa y reconoce a través del proceso de [análisis acústico] [modelo acústico] [diccionario de pronunciación] [modelo de lenguaje].

[Análisis acústico]

Las palabras de las personas varían según el género, la edad, la calidad de la voz, etc. de la persona. El análisis acústico convierte las “palabras de la persona” en datos que una computadora puede analizar fácilmente. Las “palabras humanas” en forma de ondas como las “señales analógicas” se convierten en “señales digitales” representadas por 0 o 1 dependiendo de las características de la intensidad del sonido, la frecuencia y el intervalo entre los sonidos.

[Modelo acústico]

A partir de la “señal digital” convertida, especifique el fonema de [vocal] [consonante] [repelencia al sonido], que es la unidad más pequeña emitida por los humanos.

Ejemplo) “Gracias” será [ARIGATOU].

[ Diccionario de pronunciación]

Se refiere a una gran base de datos para que los fonemas especificados puedan reconocerse como palabras para que las combinaciones tengan sentido.

Ejemplo) [ARIGATOU] es [A-RI-GA-TO-U] (Gracias)

[Modelo de idioma]

Las palabras reconocidas se convierten en palabras según el patrón de voz, se convierten en oraciones y se generan como texto. En ese momento, al referirse a los datos acumulados de antemano, se calcula la tasa de aparición de cada palabra y se mejora la consistencia del contexto por escrito.

Reconocimiento de voz y procesamiento del lenguaje natural.

El reconocimiento de voz y el procesamiento del lenguaje natural a menudo se usan juntos.

En lo anterior, se introdujo el flujo de procesamiento de voz / reconocimiento de voz, pero en realidad el campo del procesamiento de voz / reconocimiento de voz depende de la creación de texto a partir de datos de voz. Las medidas correspondientes serán tomadas por otra tecnología, el “procesamiento del lenguaje natural”.

Precisión de procesamiento de voz AI

Con el reconocimiento de voz y el procesamiento del lenguaje natural mencionados anteriormente, ahora puede operar su teléfono inteligente. ¿Lo ha usado alguna vez, porque su teléfono inteligente también tiene asistencia de voz?

Entonces, ¿qué tan preciso es el reconocimiento de voz actual de la IA?

En 2017, Microsoft e IBM lograron una tasa de reconocimiento del 95% para el reconocimiento de voz en conversaciones telefónicas y “lograron una precisión de reconocimiento equivalente a la de los humanos”. Ha anunciado. Aunque los resultados están en la situación de “pronuncié claramente en un entorno con poco ruido”, creo que la tecnología de IA, que avanza día a día, está casi completa.

Ejemplos de aplicación de procesamiento de voz y tecnología de reconocimiento de voz.

Finalmente, me gustaría presentar las situaciones en las que se utiliza dicha tecnología de procesamiento / reconocimiento de voz.

Altavoz AI

Un ejemplo de uso del reconocimiento de voz es el altavoz AI.

Cuando dices una palabra de activación y dices algo, el hablante de IA te responderá como si estuvieras hablando con alguien.

Hay varias formas de usarlo, y puede abrir y cerrar cortinas y encender y apagar el aire acondicionado diciéndole el clima mañana, las recetas y los electrodomésticos correspondientes.

Juicio de pronunciación

Para los japoneses, se dice que la pronunciación en inglés no es familiar y que es difícil aprender la pronunciación como hablantes nativos. Se dice que el atajo para mejorar su conversación en inglés es en realidad hablar y escuchar a una persona nativa. Una de las cosas que atrae la atención en la conversación en inglés es la determinación de la pronunciación AI. También se ha desarrollado un sistema en el que al permitir que el sistema de inteligencia artificial lea su propia pronunciación, se le pedirá que juzgue su propia pronunciación, realice una evaluación exhaustiva de su pronunciación e incluso le aconseje que se acerque a un hablante nativo.

Juicio emocional

Una compañía japonesa llamada Empus ha anunciado un producto original llamado “análisis de emociones de voz AI”.

Aunque los detalles de la tecnología subyacente no se han revelado, al analizar las voces de decenas de miles de personas y ensamblar sus propios algoritmos, las cuatro características de la voz se juzgan como placer, normalidad, ira y tristeza.

Leer los sentimientos de la otra persona puede conducir a oportunidades de marketing y atención de salud mental, y es el concurso número uno del mundo de TI e IA llamado “ICT Spring”.

Hemos presentado los conceptos básicos y ejemplos de procesamiento de voz y reconocimiento de voz. El ejecutivo antes mencionado de Empus dijo: “En el negocio de la inteligencia artificial y el reconocimiento de voz, la respuesta a” ¿Y qué? “Es importante”. Depende de su idea cómo aplicar dicha tecnología de procesamiento de voz / reconocimiento de voz a sus propios servicios.

Aceda al contenido original desde Aquí en japonés.


Otros temas de interés:


Posted: 2020-07-21

• La pandemia de COVID-19 es un momento decisivo para la transformación digital de los negocios; • Actualizar los modelos de negocio para …

Posted: 2020-07-20

Recientemente se habló sobre los electrodomésticos IoT que pueden operar aires acondicionados y similares mientras están afuera. Lo mejor de todo es el …

Posted: 2020-07-20

Un dispositivo que pone su negocio por delante. ACEPTAR PAGOS  Seleccione “Cashier”.  Introduzca la cantidad en moneda local.  Elija la criptomoneda. Seleccionando …

Posted: 2020-07-19

• La distribución de la vacuna COVID-19 requerirá una de las mayores capacidades de la cadena de suministro para combatir las pandemias jamás …

Posted: 2020-07-18

Un navegador web (comúnmente conocido como navegador) es una aplicación de software para recuperar, presentar y atravesar recursos de información en la …

Posted: 2020-07-17

Internet se ha arraigado en nuestras vidas como el oxígeno que respiramos en el aire. Dependemos de ello para casi todo, desde la …

Posted: 2020-07-08

El ciberespacio por naturaleza no tiene fronteras, lo que permite a esos delincuentes lanzar ataques desde cualquier parte del mundo, en cualquier …

Posted: 2020-07-04

Queridos Pundianos Gracias por su tiempo para participar en el informe de progreso del video del segundo trimestre de 2020. Le informaremos …

Posted: 2020-07-02

La manera en que hacemos las cosa puede ser mejorada constantemente, es la única parte del pensamiento organizacional que es correcto de …

Posted: 2020-07-01

Queridos Pundianos Debido a COVID-19, la mayoría de nosotros nos quedamos en casa o trabajamos desde casa. Para obtener ingresos adicionales, los miembros …

Fuente de la Noticia

You may also like

Leave a Comment

Noticias de Buenaventura y el mundo

2024 – All Right Reserved. [email protected]