Tecnologia di ripristino vocale basata sull'intelligenza artificiale sviluppata presso POSTECH. / AI‑Powered Voice Restoration Technology Developed At POSTECH

Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa

Un gruppo di ricerca del POSTECH ha sviluppato una tecnologia rivoluzionaria per il ripristino della voce, in grado di "sentire" le parole anche in assenza di suono, utilizzando sensori basati sulla luce e l'intelligenza artificiale per ricostruire il parlato a partire da lievi movimenti dei muscoli del collo.

Trasformare i movimenti silenziosi in linguaggio udibile

Guidato dal professor Sung-Min Park e dal dottor Sunguk Hong, il gruppo ha scoperto che quando una persona parla, si verificano minuscoli movimenti non solo nelle corde vocali, ma anche nei muscoli e nella pelle del collo. Questi micromovimenti formano uno schema invisibile che riflette le parole che chi parla intende pronunciare.

Per acquisire queste informazioni, i ricercatori hanno creato un sensore di mappatura della deformazione multiassiale (Multiaxial Strain Mapping Sensor), un dispositivo indossabile che combina una telecamera miniaturizzata con marcatori di riferimento incorporati in silicone morbido. Indossato comodamente sul collo, rileva anche i più piccoli movimenti della pelle. Il dispositivo corregge automaticamente gli errori di riposizionamento, garantendo prestazioni stabili nell'ambiente quotidiano.

L'intelligenza artificiale ricostruisce il parlato senza suono

I modelli di deformazione rilevati dal sensore vengono analizzati tramite intelligenza artificiale, che stima le parole o le frasi che l'utente intende pronunciare. Il sistema utilizza quindi la sintesi vocale, addestrata sulle caratteristiche vocali dell'individuo, per riprodurre la sua voce reale, anche quando rimane completamente in silenzio.

Le precedenti tecnologie di ripristino della voce si basavano su segnali EMG o EEG, ma queste richiedevano apparecchiature ingombranti e risultavano poco pratiche per l'uso quotidiano. Il sensore indossabile sviluppato dal team POSTECH supera questi limiti e ha dimostrato un'elevata precisione anche in ambienti rumorosi come le fabbriche.

Ampia gamma di applicazioni, dalla sanità all'industria.

Questa tecnologia ha ampie potenziali applicazioni. Potrebbe essere d'aiuto ai pazienti che hanno perso la voce a causa di malattie od interventi chirurgici alle corde vocali, consentire la comunicazione in ambienti industriali rumorosi dove i microfoni non funzionano, o permettere conversazioni silenziose in biblioteche, sale riunioni o spazi di lavoro condivisi.

Il professor Park ha affermato: "Ci auguriamo che questa tecnologia acceleri il giorno in cui i pazienti con disturbi del linguaggio potranno riacquistare la propria voce. Si tratta di una tecnologia degna di nota perché ha una vasta gamma di potenziali applicazioni, tra cui l'assistenza ai pazienti laringectomizzati, la comunicazione in ambienti industriali rumorosi e persino il supporto alle conversazioni silenziose."

Un passo verso la futura comunicazione uomo-macchina

Combinando sensori indossabili, intelligenza artificiale e sintesi vocale personalizzata, la ricerca rappresenta un importante passo avanti nella comunicazione uomo-macchina e nelle tecnologie assistive di nuova generazione.

ENGLISH

A research team at POSTECH has developed a breakthrough voice restoration technology that can “hear” words even when no sound is produced, using light‑based sensing and AI to reconstruct speech from subtle neck muscle movements.

Turning Silent Movements Into Audible Speech

Led by Professor Sung‑Min Park and Dr Sunguk Hong, the team discovered that when a person speaks, tiny movements occur not only in the vocal cords but also across the muscles and skin of the neck. These micro‑movements form an invisible pattern that reflects the speaker’s intended words.

To capture this information, the researchers created a Multiaxial Strain Mapping Sensor—a wearable device combining a miniature camera with reference markers embedded in soft silicone. Worn comfortably on the neck, it detects even the smallest skin movements. The device automatically corrects for repositioning errors, ensuring stable performance in everyday environments.

AI Reconstructs Speech Without Sound

The strain patterns collected by the sensor are analysed using AI, which estimates the user’s intended words or sentences. The system then uses voice synthesis trained on the individual’s vocal characteristics to reproduce their actual voice—even when they remain completely silent.

Previous voice restoration technologies relied on EMG or EEG signals, but these required bulky equipment and were impractical for daily use. The POSTECH team’s wearable sensor overcomes these limitations and demonstrated high accuracy even in noisy environments such as factories.

Wide Applications From Healthcare To Industry

The technology has broad potential applications. It could support patients who have lost their voices due to vocal cord disease or surgery, enable communication in loud industrial settings where microphones fail, or allow silent conversations in libraries, meeting rooms or shared workspaces.

Professor Park said: “We hope this technology will accelerate the day when patients with speech disorders can reclaim their voices. It is a noteworthy technology because it has a wide range of potential applications, including assisting laryngectomized patients, communicating in noisy industrial environments, and even supporting silent conversations.”

A Step Toward Future Human–Machine Communication

By combining wearable sensing, AI and personalised voice synthesis, the research marks a major step forward in human–machine communication and next‑generation assistive technologie

Da:

https://www.eurekamagazine.co.uk/content/news/ai-powered-voice-restoration-technology-developed-at-postech?utm_source=content_recommendation&utm_medium=blueconic

Cerca nel blog

GENIO italiano Giuseppe Cotellessa