改善醫(yī)療環(huán)境中語音轉(zhuǎn)文本技術(shù)的發(fā)音
語音轉(zhuǎn)文本程序在日常任務(wù)中越來越受歡迎,例如免提聽寫、幫助視障人士以及為聽力障礙者轉(zhuǎn)錄語音。這些工具有很多用途,格但斯克理工大學(xué)的研究員 Bo?ena Kostek 正在探索如何更好地將 STT 應(yīng)用于醫(yī)療領(lǐng)域。通過研究清晰的語音如何影響 STT 準(zhǔn)確性,她希望提高其對醫(yī)療保健專業(yè)人員的實用性。
科斯特克說:“自動記錄患者數(shù)據(jù)對于醫(yī)生和放射科醫(yī)生來說至關(guān)重要,因為它讓醫(yī)生有更多的時間與患者面對面交流,并能更好地收集數(shù)據(jù)。”
Kostek還解釋了他們在這項工作中面臨的挑戰(zhàn)。
“STT 模型經(jīng)常難以理解醫(yī)學(xué)術(shù)語,尤其是波蘭語,因為許多模型主要接受英語訓(xùn)練。此外,大多數(shù)資源都側(cè)重于簡單語言,而不是專業(yè)的醫(yī)學(xué)詞匯。嘈雜的醫(yī)院環(huán)境使情況更加困難,因為醫(yī)護人員可能由于壓力或分心而無法清晰地說話。”
為了解決這些問題,研究人員創(chuàng)建了一個詳細(xì)的音頻數(shù)據(jù)集,其中包含心臟病學(xué)和肺病學(xué)等領(lǐng)域的醫(yī)生和專家所說的波蘭醫(yī)學(xué)術(shù)語。研究人員使用自動語音識別模型(一種將語音轉(zhuǎn)換為文本的技術(shù))分析了該數(shù)據(jù)集,并將其轉(zhuǎn)錄。研究人員使用了多個指標(biāo)(例如單詞錯誤率和字符錯誤率)來評估語音識別的質(zhì)量。該分析有助于了解語音清晰度和風(fēng)格如何影響 STT 的準(zhǔn)確性。
免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。