Red de conocimientos sobre prescripción popular - Conocimiento de perdida de peso - ¿Qué significa la huella de voz de la resistencia que varía en el tiempo?

¿Qué significa la huella de voz de la resistencia que varía en el tiempo?

Estoy haciendo una identificación de huellas de voz. Este tipo de ciencia forense, también llamada identificación por voz e identificación de voz forense, pertenece a la categoría de identificación por voz. Me encontré con la situación de un cambiador de voz y finalmente di la misma conclusión de identificación (el proceso no es obvio).

Tomando prestado de mi artículo "¿Podemos identificar la pronunciación imitada?", primero debemos introducir la especificidad y estabilidad de la pronunciación. (Este es el principio básico del reconocimiento de huellas de voz. Varios libros de texto tienen diferentes estilos de expresión, pero todos dicen lo mismo. La primera lección que enseño a los estudiantes es permitirles recordar este principio):

Debido Debido a la particularidad de la pronunciación, los órganos vocales se dividen en sistema supraglótico, sistema laríngeo y sistema subglótico. Cada uno tiene su propio conjunto de órganos vocales y sus formas y estructuras son diferentes. Cada pronunciación requiere que muchos órganos vocales cooperen y se muevan juntos. Esto determina las propiedades físicas del habla (también llamadas los cuatro elementos del habla): calidad del sonido, duración del sonido, intensidad del sonido y tono. Estas cantidades físicas varían de persona a persona, por lo que los sonidos muestran diferentes características de huella de voz en el mapa de huellas de voz. A partir de estos parámetros característicos de la huella vocal, no sólo se pueden distinguir voces, sino que también se pueden identificar las voces de una misma persona.

Estabilidad del habla. Una vez que el órgano vocal de una persona madura, su estructura anatómica y su estado fisiológico son estables, y los atributos sociales y psicológicos de la pronunciación, como los hábitos de habla del hablante, hacen que si todos hablan el mismo contenido de texto en diferentes momentos, la fonética básica Las características son estables. Por lo tanto, puedes pensar en la voz humana como la trompeta de un instrumento de viento. Aunque el trombón y la corneta son trompetas, su calidad de sonido también es diferente debido a las diferentes formas y longitudes de sus tractos vocales.

Actualmente, existen dos métodos de reconocimiento de huellas de voz:

Primero, la "identificación manual" ampliamente utilizada en la práctica judicial de China: los peritos tasadores se basan en métodos fonéticos.

La segunda es la dirección de desarrollo futuro del "reconocimiento automático": la computadora simula la extracción, entrenamiento y comparación de características acústicas por parte del oído humano a través de algoritmos.

Entonces, ¿qué clase de cosa profunda es un "cambiador de voz"? Un cambiador de voz es una herramienta que cambia el timbre y el tono del audio de entrada y emite el audio modificado (Enciclopedia Baidu). De hecho, también existe la velocidad del sonido, pero la Enciclopedia Baidu la pasó por alto. Además, ni que decir tiene que el volumen del sonido se puede cambiar sin necesidad de un cambiador de voz. Luego, los cuatro elementos del habla: timbre, tono (tono correspondiente), intensidad del sonido (volumen del sonido correspondiente) y duración del sonido (velocidad del sonido correspondiente) han cambiado, y las propiedades físicas del habla también han cambiado. ¿Cómo identificarlos?

aNo pienses tan profundamente en el “cambiador de voz”

En reconocimiento, ¿no es el “cambiador de voz” solo un canal? La definición de canal es el canal para la transmisión de señales y nuestro reconocimiento se llama reconocimiento de huellas de voz. De hecho, lo que se analiza y prueba no es la voz humana real, sino la grabación de la persona: la señal sonora. Varios equipos de grabación pueden considerarse canales y varios métodos de codificación también pueden considerarse canales, todos los cuales cambian la señal de sonido. Por ejemplo, los walkie-talkies y los teléfonos son todos canales. Su voz se transmite a través de un walkie-talkie y su audición se ha distorsionado. Ya has sentido el efecto del canal en la señal de voz. Los "cambiadores de voz" actualmente disponibles en el mercado, ya sean hardware o software, cambian principalmente la frecuencia fundamental y convierten los sonidos profundos (voces masculinas) en sonidos agudos (voces femeninas, voces infantiles). (En cuanto al cambio de timbre, por un lado, el timbre debe haber cambiado. Después de que el remuestreo cambia la frecuencia fundamental, las características de pico del timbre deben haber cambiado. Por otro lado, el cambio de su * * * pico de vibración cambia en su conjunto, y la relación relativa se puede ver es una constante). Por supuesto, para ser precisos, es solo la llamada voz masculina, voz femenina, voz de niño y voz de anciano en nuestro oído y comprensión social. La voz no es una característica sexual y no se puede diferenciar entre hombres y mujeres, sólo se puede contar. Un contraejemplo es la voz de "Zheng", que es muy alta y tiene una cuerda vocal larga (correlación positiva). Busque en línea y escuche. ¿Te consideras niño o niña? Además, Conan usó un cambiador de voz para transformarse mágicamente en Kogoro Mori en el manga. En realidad, es imposible lograr tal precisión y lograr tan buenos resultados. En teoría, sólo requeriría recolectar cantidades masivas de datos acústicos de Kogoro Mori.

Un "cambiador de voz" cambia las características físicas del sonido, en lugar de todas las características acústicas en el sentido evaluativo.

Como se mencionó anteriormente, la principal ventaja de los métodos de reconocimiento de voz artificial comúnmente utilizados es que pueden distinguir "características avanzadas de huellas de voz" que son difíciles de reconocer para las computadoras, como acentos dialectales, modismos, palabras redundantes, fonéticas. defectos y rasgos prosódicos. ¿Qué clase de "avanzado" es este? Lo primero que sabemos sobre la identificación de la voz de una persona es a través de estas características; los espectáculos de imitación también otorgan gran importancia a dichas características a la hora de imitar.

Pero a las computadoras les resulta difícil reconocerlo. Esto se llama "función avanzada". Sí, el oído humano es el instrumento de reconocimiento de huellas de voz más sofisticado. Las "características de huellas de voz de bajo nivel" con las que los no profesionales no están familiarizados, como picos de vibración, frecuencias fundamentales, etc., son más familiares para las computadoras, incluso la intensidad del sonido, la duración del sonido y el VOT pueden ser reconocidos por las computadoras.

c "Voice Changer" cambia las propiedades físicas del habla y también puede utilizar el mismo método para cambiar muestras al identificar muestras.

Ya sea identificación manual o identificación automática, la comparación se realiza mediante el registro del caso - "material de examen" y el registro del sospechoso - "muestra". Dado que el cambiador de voz es una "muestra" que ha sido modificada por ciertas configuraciones, solo necesita cambiar la "muestra" con la misma configuración. Como se mencionó anteriormente, un cambiador de voz es un canal generalizado. Había una vez un tasador que pensaba que el sonido estaba distorsionado porque se trataba de un caso de "cambiador de voz", y había que restablecer el sonido anterior a través de la señal para realizar la tasación. Este tipo de pensamiento, y mucho menos la tecnología actual, la recuperación de canales no es recuperable en absoluto, principalmente porque no se considera. Identificamos los registros que se están analizando, ¿cuáles no son resultado del procesamiento de la señal a través del canal? No importa cuán alta sea la frecuencia de muestreo, no importa cuán fina sea la precisión, también es el resultado de cambios discretos. ¿Puede realmente ser igual a una señal continua como la voz humana? Todos pasan por canales y procesamiento de señales, pero la diferencia es diferente en tamaño y la experiencia auditiva es diferente.

Pregunta 2: ¿Es correcto decir "las ondas sonoras son iguales a las huellas dactilares y pueden identificarse sin importar cómo cambien"?

Respuesta: No.

El término "onda sonora" es incorrecto. Cada vez que escucho la palabra "sónico" pienso en murciélagos, un término que suelen utilizar los profanos. Las personas que se especializan en el reconocimiento de huellas de voz tienen una buena comprensión del reconocimiento, pero una comprensión superficial de la física y el procesamiento de señales, y no saben mucho sobre los murciélagos y otras criaturas. En la práctica judicial, jueces, fiscales e investigadores de seguridad pública consideran nuestras opiniones profesionales como su autoridad. En cuanto a los profesores de distintas facultades de derecho, pueden tener opiniones diferentes, pero dicen que se puede calcular. ¿Por qué necesitan jueces? Para responder a esta pregunta con precisión, busqué en Baidu y los artículos que aparecieron allí fueron escritos por mí, por mis profesores o por colegas con los que estaba familiarizado. En otras palabras, todas estas interpretaciones paradójicas e incluso contradictorias sobre Baidu provienen de nuestra diferente comprensión y expresión de la misma cosa. El término "huella de voz" fue definido por los primeros tasadores cuando esta ciencia y tecnología forense se introdujeron en China en la década de 1980. Este título se basa en el mapa de voz utilizado por el método de reconocimiento de voz, que es fácil de entender y de utilizar habitualmente. "Reconocimiento de huellas de voz" es el término general para todo el reconocimiento de voz, incluido el reconocimiento de la misma voz, las pruebas de autenticidad de las grabaciones, la reducción del ruido del habla y la mejora de la relación señal-ruido. También se refiere al reconocimiento de identidades de voz individuales. "Voiceprint" es la abreviatura de voiceprint, la base principal para la identificación; también es el término general para designar la voz como característica biológica; En la actualidad, se han desarrollado métodos de identificación. El método de análisis de características acústicas mediante espectrograma no es el único método de identificación, por lo que es más exacto llamarlo "identificación de voz forense" y más conveniente llamarlo "identificación de huella de voz". En resumen, puedes llamar al amor como quieras, pero no se le puede llamar "onda sonora" porque "onda sonora" significa otra cosa.

"Onda sonora" es diferente de "huella de voz"

Debido a la diferencia en traducción y comprensión, probablemente proviene de estas palabras: onda sonora, espectro, sonido, formante, intensidad. . Si el tasador habla de ondas sonoras, debe estar refiriéndose al diagrama de forma de onda (ver Figura 1) y a la intensidad. En el reconocimiento fonético de huellas de voz, no es la característica principal. La característica principal son los formantes y los picos de vibración (ver Figura 2).

上篇: Escuché que algunas personas en Guangdong y Guangxi comen gatos. ¿Cómo los comen? 下篇: