به گزارش شفاآنلاین:اما برای برخی از ما، تغییر صدای دیگری وجود دارد، زمانی که یک بیماری شروع می شود یا زمانی که سلامت روانی ما دست خوش تغییر می شود. به همین دلیل است که پزشکان بیشتری به صدا به عنوان یک نشانگر زیستی نگاه می کنند؛ چیزی که به شما می گوید یک بیماری وجود دارد.
علائم حیاتی مانند فشار خون یا ضربان قلب «می تواند یک ایده کلی از میزان بیماری ما ارائه دهد. »
او میگوید: «ما در حال یادگیری الگوهایی در تغییرات صدا هستیم که میتواند طیفی از شرایط، از جمله بیماریهای سیستم عصبی و بیماریهای روانی را نشان دهد. »
صحبت کردن پیچیده است و شامل همه چیز از ریه ها و حنجره گرفته تا دهان و مغز می شود. دکتر ماریا پاول، استادیار گوش و حلق و بینی (مطالعه بیماری های گوش و گلو) در دانشگاه واندربیلت در نشویل، که روی پروژه NIH کار می کند، می گوید: «خرابی در هر یک از این قسمت ها می تواند بر صدا تأثیر بگذارد. »
شما یا اطرافیانتان ممکن است متوجه این تغییرات نشوید، اما محققان می گویند تجزیه و تحلیل صدا به عنوان بخشی استاندارد از مراقبت از بیمار (شبیه به آزمایش فشار خون یا آزمایش کلسترول) می تواند به شناسایی افرادی که زودتر به مراقبت های پزشکی نیاز دارند کمک کند.
آریانا اندرسون، دکترا، مدیر آزمایشگاه عصب روانشناسی محاسباتی UCLA، میگوید: «اغلب، تنها چیزی که لازم است یک گوشی هوشمند است »
فرانک رودزیچ، دکترا، دانشمند کامپیوتر برای پروژه NIH میگوید: «میتوانید دادههای صوتی را با لباس خواب خود، روی مبل خود ارائه دهید، این به تجهیزات بسیار پیچیده یا گران قیمت نیاز ندارد و برای به دست آوردن آن به تخصص زیادی نیاز نیست. »
به علاوه، نمونه های متعددی را می توان در طول زمان جمع آوری کرد .
طی 4 سال آینده، تیم Voice as a Biomarker نزدیک به 18 میلیون دلار برای جمع آوری حجم عظیمی از داده های صوتی دریافت خواهد کرد . هدف 20000 تا 30000 نمونه به همراه داده های سلامتی در مورد هر فرد مورد مطالعه است؛ نتیجه یک پایگاه داده گسترده خواهد بود که دانشمندان می توانند از آن برای توسعه الگوریتم هایی استفاده کنند که شرایط سلامتی را به نحوه صحبت کردن ما مرتبط می کند.
برای 2 سال اول، داده های جدید منحصراً از طریق دانشگاه ها و کلینیک های با حجم بالا برای کنترل کیفیت و دقت جمع آوری می شود. در نهایت، از مردم دعوت می شود تا صدای ضبط شده خود را ارسال کنند و یک مجموعه داده ایجاد کنند.
Bensoussan میگوید: «گوگل، الکسا، آمازون – آنها به حجم زیادی از دادههای صوتی دسترسی دارند، اما از نظر بالینی قابل استفاده نیست، زیرا آنها اطلاعات بهداشتی ندارند.»
Bensoussan و همکارانش امیدوارند که این خلاء را با برنامه های پیشرفته غربالگری صدا پر کنند، که می تواند به ویژه در جوامع دوردست که دسترسی به متخصصان یا ابزاری برای پزشکی از راه دور ندارند، ارزشمند باشد. در پایان، دستگاههای پوشیدنی با آنالیز صدا میتوانند به افراد مبتلا به بیماریهای مزمن در هنگام نیاز به مراجعه به پزشک هشدار دهند.
ساعت میگوید:« من تنفس و سرفههای شما را تجزیه و تحلیل کردهام، و امروز واقعاً خوب نیستید. شما باید به بیمارستان بروید. او میتواند به مردم بگوید که اوضاع رو به بهبود یا وخامت است»
هوش مصنوعی ممکن است بهتر از مغز در تشخیص بیماری مناسب باشد؛ برای مثال، گفتار نامفهوم میتواند نشان دهنده پارکینسون، سکته مغزی یا ALS باشد.
رودزیچ میگوید: «ما میتوانیم تقریباً هفت قطعه اطلاعات را در یک زمان در ذهن خود نگه داریم. برای ما واقعا سخت است که با استفاده از ده ها یا صدها متغیر به طور همزمان یک تصویر کل نگر بدست آوریم؛ اما یک کامپیوتر می تواند طیف وسیعی از نشانگرهای صوتی را به طور همزمان در نظر بگیرد و آنها را برای ارزیابی دقیق تر کنار هم قرار دهد.»
بنسوسان می گوید: «هدف پیشی گرفتن از یک ... پزشک بالینی نیست؛ با این حال، این پتانسیل به طور غیرقابل انکار وجود دارد: در یک مطالعه اخیر روی بیماران مبتلا به سرطان حنجره، یک ابزار تجزیه و تحلیل صوتی خودکار با دقت بیشتری نسبت به حنجره شناسان این بیماری را نشان می دهد.
اندرسون که اپلیکیشنی به نام ChatterBaby توسعه داده است که گریه های نوزاد را تجزیه و تحلیل می کند، می گوید: «الگوریتم ها پایگاه آموزشی بزرگ تری دارند. ما یک میلیون نمونه برای آموزش الگوریتم های خود در اختیار داریم. نمی دانم در زندگی ام صدای گریه میلیون ها نوزاد مختلف را شنیده ام یا نه.»
بنابراین کدام شرایط سلامتی بیشترین امید را برای تجزیه و تحلیل صدا دارند؟ پروژه Voice as a Biomarker بر پنج دسته تمرکز خواهد داشت.
بدیهی است که تغییرات صوتی یکی از مشخصههای این شرایط است که باعث ایجاد مواردی مانند تنفس یا زبری میشود که نوعی بینظمی در صدا است. گرفتگی صدا که حداقل 2 هفته طول بکشد اغلب یکی از اولین علائم سرطان حنجره است. با این حال ممکن است ماه ها طول بکشد (یک مطالعه نشان داد که میانگین 16 هفته بود) تا بیماران پس از مشاهده تغییرات به پزشک مراجعه کنند. حتی در آن زمان، حنجره شناسان هنوز با تکیه بر نشانه های صوتی، برخی موارد سرطان را اشتباه تشخیص می دادند.
حال سناریوی متفاوتی را تصور کنید: بیمار در یک اپلیکیشن گوشی هوشمند صحبت می کند. الگوریتمی نمونه صوتی را با صدای بیماران مبتلا به سرطان حنجره مقایسه می کند. این برنامه شانس تخمینی سرطان حنجره را نشان می دهد و به ارائه دهندگان کمک می کند تصمیم بگیرند که آیا مراقبت های تخصصی را به بیمار ارائه دهند یا خیر.
یا نارسایی اسپاسمودیک را در نظر بگیرید، یک اختلال صوتی عصبی که باعث ایجاد اسپاسم در عضلات حنجره میشود و باعث کشیدگی یا تنفس میشود. پزشکانی که تجربه ای در مورد اختلالات صوتی ندارند ممکن است این بیماری را از دست بدهند. پاول میگوید: به همین دلیل است که تشخیص به طور متوسط تقریباً 4 سال و نیم طول میکشد، طبق مطالعهای در مجله صدا و ممکن است شامل همه چیز از آزمایش آلرژی گرفته تا ارزیابی روانپزشکی باشد.
فناوری هوش مصنوعی آموزش دیده برای تشخیص این اختلال می تواند به حذف چنین آزمایش های غیر ضروری کمک کند.
دکتر Anais Rameau، استادیار حنجرهشناسی در کالج پزشکی ویل کورنل و یکی دیگر از اعضای پروژه NIH میگوید: برای آلزایمر و پارکینسون، «یکی از اولین تغییرات قابل توجه صدا است» که معمولاً قبل از تشخیص رسمی ظاهر میشود. پارکینسون ممکن است صدا را نرم کند یا آن را یکنواخت کند، در حالی که بیماری الزایمر ممکن است محتوای گفتار را تغییر دهد و منجر به افزایش " ام " و ترجیح ضمایر بر اسم شود.
با پارکینسون، تغییرات صوتی می تواند چندین دهه قبل از تحت تاثیر قرار گرفتن حرکت رخ دهد. دکتر مکس لیتل، مدیر پروژه ابتکار صدای پارکینسون، می گوید: «اگر پزشکان بتوانند بیماری را در این مرحله، قبل از ظهور لرزش تشخیص دهند، ممکن است بتوانند بیماران را برای مداخله زودهنگام علامت گذاری کنند. » این مرحله ای مقدس برای یافتن یک درمان نهایی است."
باز هم، تلفن هوشمند پتانسیل را نشان می دهد. در یک مطالعه استرالیایی در سال 2022، یک برنامه مجهز به هوش مصنوعی قادر بود افراد مبتلا به پارکینسون را بر اساس صدای ضبط شده مختصر شناسایی کند، اگرچه حجم نمونه کوچک بود.
در مقیاس بزرگتر، ابتکار صدای پارکینسون حدود 17000 نمونه از مردم سراسر جهان جمع آوری کرد. لیتل می گوید: «هدف این بود که افراد مبتلا به این بیماری را از راه دور با استفاده از تماس تلفنی شناسایی کنیم. این کار را با دقت 65 درصد انجام داد.» او می گوید: «در حالی که این برای استفاده بالینی به اندازه کافی دقیق نیست، پتانسیل این ایده را نشان می دهد.
Rudzicz روی تیم پشتیبان Winterlight، یک برنامه iPad که 550 ویژگی گفتار را برای تشخیص زوال عقل و آلزایمر (و همچنین بیماری های روانی) تجزیه و تحلیل می کند، کار کرد.
او میگوید: «ما آن را در مراکز مراقبت طولانیمدت مستقر کردیم» و بیمارانی را که نیاز به بازبینی بیشتر در مهارتهای ذهنی خود دارند، شناسایی کردیم. اندرسون می گوید: «سکته مغزی یکی دیگر از زمینه های مورد علاقه است، زیرا گفتار نامفهوم یک معیار بسیار ذهنی است. فناوری هوش مصنوعی می تواند ارزیابی عینی تری ارائه دهد. »
هیچ بیومارکر ثابتی برای تشخیص افسردگی وجود ندارد؛ با این حال، اگر احساس ناراحتی میکنید، احتمالاً دوستانتان میتوانند به شما بگویند؛ حتی از طریق تلفن.
پاول می گوید: «ما مقدار زیادی از خلق و خوی خود را در صدای خود حمل می کنیم. اختلال دوقطبی همچنین میتواند صدا را تغییر دهد و در دورههای شیدایی بلندتر و سریعتر و سپس در دورههای افسردگی کندتر و آرامتر کند.»
اندرسون می گوید که مرحله کاتاتونیک اسکیزوفرنی اغلب با «صدای بسیار یکنواخت و روباتیک مانند همراه است.» اینها همه مواردی هستند که یک الگوریتم می تواند اندازه گیری کند.
برنامهها در حال حاضر (اغلب در تنظیمات تحقیقاتی) برای نظارت بر صداها در طول تماسهای تلفنی، تجزیه و تحلیل نرخ، ریتم، صدا و زیر و بم، برای پیشبینی تغییرات خلقی استفاده میشوند؛ به عنوان مثال، پروژه PRIORI در دانشگاه میشیگان در حال کار بر روی یک اپلیکیشن گوشی هوشمند برای شناسایی تغییرات خلقی در افراد مبتلا به اختلال دوقطبی، به ویژه تغییراتی است که می تواند خطر خودکشی را افزایش دهد.
محتوای گفتار نیز ممکن است سرنخ هایی ارائه دهد. در یک مطالعه UCLA، منتشر شده در مجله PLOS One ، افراد مبتلا به بیماری های روانی به سوالات برنامه ریزی شده کامپیوتری (مانند "در چند روز گذشته چطور بودید؟") پاسخ دادند.
یک برنامه انتخاب کلمات آنها را تجزیه و تحلیل کرد و به نحوه تغییر آنها در طول زمان توجه کرد. محققان دریافتند که تجزیه و تحلیل هوش مصنوعی خلق و خو با ارزیابی های پزشکان مطابقت دارد و برخی از افراد در این مطالعه در واقع احساس راحتی بیشتری در صحبت کردن با رایانه داشتند.
فراتر از صحبت کردن، صداهای تنفسی مانند نفس نفس زدن یا سرفه ممکن است به شرایط خاصی اشاره کنند. بنسوسان می گوید: «سرفه آمفیزم متفاوت است، سرفه ی COPD نیزمتفاوت است. محققان در تلاشند تا دریابند که آیا COVID-19 سرفه مشخصی دارد یا خیر.
صداهای تنفسی نیز می توانند به عنوان علائم راهنما باشند. بنسوسان میگوید: «زمانی که نمیتوانیم نفس بکشیم، صداهای مختلفی شنیده میشود. یکی از آنها استریدور نامیده می شود، خس سینه با صدای بلند که اغلب به دلیل مسدود شدن راه هوایی ایجاد می شود. »
بنسوسان میگوید: «من تعداد زیادی از افراد [مبتلا به استریدور] را میبینم که برای سالها به اشتباه تشخیص داده میشوند؛ به آنها گفته شده است که آسم دارند، اما ندارند. تجزیه و تحلیل هوش مصنوعی این صداها می تواند به پزشکان در شناسایی سریعتر اختلالات تنفسی کمک کند. »
اندرسون می گوید، نوزادانی که بعداً مبتلا به اوتیسم می شوند، در اوایل 6 ماهگی گریه متفاوتی می کنند، به این معنی که اپلیکیشنی مانند ChatterBaby می تواند به کودکان برای مداخله زودهنگام کمک کند.
اوتیسم با چندین تشخیص دیگر مانند صرع و اختلالات خواب مرتبط است. بنابراین تجزیه و تحلیل گریه یک نوزاد می تواند پزشکان اطفال را وادار کند تا طیف وسیعی از شرایط را بررسی کنند.
اندرسون میگوید ChatterBaby در تشخیص زمانی که نوزادان درد میکشند «بسیار دقیق» عمل کرده است، زیرا درد تنش عضلانی را افزایش میدهد و در نتیجه گریه بلندتر و هیجانی تر میشود.
هدف بعدی:
«ما در حال جمعآوری صداهای نوزادان در سراسر جهان هستیم» و سپس آن کودکان را به مدت 7 سال دنبال میکنیم تا ببینیم آیا علائم صوتی اولیه میتوانند اختلالات رشدی را پیشبینی کنند یا خیر.
نمونههای آوازی از کودکان خردسال میتواند هدف مشابهی را دنبال کند.
در نهایت، فناوری هوش مصنوعی ممکن است تغییرات صوتی مربوط به بیماری را که ما حتی نمی توانیم بشنویم، دریافت کند. در یک مطالعه جدید در کلینیک مایو، برخی ویژگیهای صوتی قابل تشخیص توسط هوش مصنوعی (اما نه توسط گوش انسان) با افزایش سه برابری احتمال تجمع پلاک در شریانها مرتبط بود.
دکتر امیر لرمن، نویسنده این مطالعه توضیح می دهد: «صدا طیف عظیمی از ارتعاشات است. ما یک محدوده بسیار کوتاهی می شنویم.»
محققان مطمئن نیستند که چرا بیماری قلبی صدا را تغییر می دهد، اما سیستم عصبی خودمختار ممکن است نقشی داشته باشد، زیرا حنجره و همچنین فشار خون و ضربان قلب را تنظیم می کند.
لرمن می گوید سایر بیماری ها، مانند بیماری های اعصاب و روده، ممکن است به طور مشابه صدا را تغییر دهند.فراتر از غربالگری بیمار، این کشف می تواند به پزشکان کمک کند تا دوز دارو را از راه دور، مطابق با این سیگنال های صوتی نامشهود تنظیم کنند.
لرمن میگوید: «امیدوارم در چند سال آینده، این مورد عملی شود. »
با این حال، در مواجهه با این امید، نگرانی های حفظ حریم خصوصی همچنان باقی است.
Voice یک شناسه است که توسط قانون قابل حمل و پاسخگویی بیمه سلامت فدرال محافظت می شود، که به حفظ حریم خصوصی اطلاعات سلامت شخصی نیاز دارد.
Bensoussanمیگوید که این دلیل عمدهای است که چرا هنوز پایگاه داده صوتی بزرگی وجود ندارد. (این امر جمع آوری نمونه از کودکان را به ویژه چالش برانگیز می کند.) شاید نگران کننده تر، پتانسیل تشخیص بیماری تنها بر اساس صدا باشد.
رامو می گوید: «شما می توانید از این ابزار برای هر کسی، از جمله مقاماتی مانند رئیس جمهور استفاده کنید. »
اما مانع اصلی، منبع یابی اخلاقی داده ها برای اطمینان از تنوع نمونه های صوتی است. برای پروژه Voice as a Biomarker، محققان سهمیههای صوتی را برای نژادها و قومیتهای مختلف ایجاد میکنند و مطمئن میشوند که الگوریتمها میتوانند طیفی از لهجهها را بهطور دقیق تحلیل کنند. دادههای افرادی که دارای اختلالات گفتاری هستند نیز جمعآوری خواهد شد.
با وجود این چالش ها، محققان همچنان خوش بین هستند