כאשר אבות אבותינו הקדמונים הצטופפו סביב המדורות שלהם, החליפו סיפורים, תכננו ציד עתידי או התריעו בפני סכנה, הגמישות הקולית אפשרה להם להוסיף נפח אינפורמטיבי לתקשורת. כל שינוי בטון הקול נשא עמו משמעות, ושימוש נכון במחוות קוליות הגביר את סיכויי ההישרדות של אוכלוסייה וחיזק את מערכות היחסים בין הפרטים. גם כיום, הטונים הקוליים שלנו ממשיכים להעביר רגשות ודקויות שהתיאורים המילוליים המפורטים ביותר עלולים לא לספק ("זה לא מה שאמרת, זה איך שאמרת את זה").
עוד בנושא זה:
בעידן שבו תקשורת מבוססת טקסט הפכה לנורמה, הצבעוניות הקולית הולכת לאיבוד, ומוחלפת בסימנים מונוכרומטיים על המסך. ללא המנגינה של הטון, קצב הדיבור ותזמורת של רמזים לא מילוליים אחרים, מסרים טקסטואליים לעתים קרובות לא מובנים או מפורשים לא נכון, ממש כמו שמחמאה עשויה להישמע לא כנה ללא הגוון הקולי המתאים. הדקויות שהופכות את התקשורת שלנו לעשירה ומשמעותית יכולות בקלות להתפרש בצורה לא נכונה בעולם האותיות השקט. כלומר, לקול עצמו יש מקום של כבוד בתקשורת האנושית, מכיוון שהוא כולל אינפורמציה חשובה, שלא מועברת בדרך אחרת.
מעבר לכוונותיו של הדובר, קולו של אדם יכול לכלול מידע נוסף שלעיתים חומק מאוזנינו – מידע שלפעמים קשור באופן ישיר למצבו הבריאותי. לדוגמה, אני יכול לזהות מיד אם אחד מקרוביי חולה, רק מלהבחין בשינוי בקול שלהם. גם כשהקול שלהם מועבר אלי באמצעות תיווך טכנולוגי, כמו לדוגמה דרך הטלפון, אני מצליח לזהות את מקרי החולי בדיוק די טוב. המוח שלי קולט את הקול, שכולל ממד אינפורמטיבי נוסף מלבד המילים עצמן, מעבד אותו ומבצע חישובים ומסיק "חולה או בריא".
"אני אולי מסוגל לזהות שאחד הקרובים אלי מצונן, אבל בינה מלאכותית מסוגלת לאבחן מצבים מורכבים בהרבה, כגון מצבים לבביים, לזהות מגוון וירוסים, דלקת ריאות ועוד"
באופן דומה, תוכנות בינה מלאכותית, הבנויות על עקרונות המוח האנושי, מאפשרות לנו להעניק יכולות למכונות שעד לא מזמן היו שמורות רק למוח האנושי, כמו עיבוד מידע קולי. בינה מלאכותית יכולה ליירט סממנים קוליים שיחמקו מאוזן ומוח אנושיים, ולהסיק מהם מידע רפואי חשוב.
ניתוח קול על ידי תוכנות בינה מלאכותית לצרכים רפואיים הוא תחום משגשג בהחלט בתקופה האחרונה, ולמרות זאת הוא עדיין בחיתוליו, יחסית לתחומים כמו עיבוד תמונה, טקסט, נתונים גנטיים ונתונים פיזיולוגיים שונים. אני אולי מסוגל לזהות שאחד הקרובים אלי מצונן, אבל בינה מלאכותית מסוגלת לאבחן מצבים מורכבים בהרבה, כגון מצבים לבביים, לזהות מגוון וירוסים, לאבחן דלקת ריאות ועוד. אנחנו עדים למגוון חברות ומוצרים המיועדים לניתוח הקול שלנו לצרכים רפואיים. לדוגמא, חברה גרמנית בשם Audeering מפתחת בדיקת קורונה קולית. בלי ללכת ולקנות בדיקה, בלי מטוש לאף, ובמהירות מקסימלית.
במחקר שפורסם אשתקד ב-Mayo Clinic Proceedings, מצאו כי מאפיין קול ייחודי יכול לחזות מחלות לב. במסגרת המחקר הקליטו באמצעות סמארטפון את קולם של 108 מטופלים במשך 30 שניות לפני בדיקת לב. החוקרים ניתחו את הקלטות הקול הללו ועקבו אחרי המטופלים במשך כמה שנים. המחקר מצא שלמטופלים עם ערך גבוה של מאפיין קולי מסוים יש סיכוי גבוה יותר לסבול מבעיות הקשורות ללב בעתיד. כלומר, על-ידי ניתוח קולי לא פולשני ניתן לחזות את הסיכון למחלות לב.
הסטארט-אפ הישראלי Cordio Medical כבר פועל בתחום – מערכת שפיתחו מנתחת את קולו של המטופל ויכולה לזהות הצטברות של נוזלים הקשורה לאי-ספיקת לב.
אבחון מוקדם יגדיל את סיכויי הצלחת הטיפול
התפתחות תחום העיבוד הקולי על-ידי בינה מלאכותית צפוי לגרום לפריצת דרך של ממש בכל הקשור להנגשה של שירותי הרפואה. דמיינו מצב שבו בוט בינה מלאכותית של חברה בארצות הברית מצלצל לאדם שנמצא באוגנדה (שאין לו סמארטפון ויכול לבצע רק שיחות קוליות) מקיים איתו שיחה באורך של דקה אחת ומספק אבחון רפואי על סמך הניתוח הקולי של השיחה.
דגימות קול של מטופלים נאספות במרכזים רפואיים ברחבי העולם, בדרך לפיתוח חוש שמיעה דיגיטלי עבור תוכנות בינה מלאכותית. מהנדסים וקלינאים משתמשים בדגימות הקול הללו כדי ללמד תוכנות בינה המלאכותית להקשיב ולנתח דפוסי קול, קצב נשימה, שיעול ואפילו חריגות בדיבור. הרעיון הוא לנתח את המידע הקולי עד לדקויות העדינות ביותר, כמו שכבר עושים שנים בכל הנוגע לזיהוי גידולים בבדיקות שונות כגון אולטרסאונד ו-MRI. לדוגמה, לאנשים עם מחלת פרקינסון יש לעיתים קרובות רעד בקול, בעוד שאנשים עם אלצהיימר עלולים להתקשות בהגיית מילים מסוימות. בינה מלאכותית יכולה לזהות את השינויים האלה ולהשתמש בהם כדי לאבחן מחלות בשלב מוקדם, ובכך להגדיל את סיכויי ההצלחה של הטיפול.
לאנשים עם מחלת פרקינסון יש לעיתים קרובות רעד בקול, בעוד שאנשים עם אלצהיימר עלולים להתקשות בהגיית מילים מסוימות. בינה מלאכותית יכולה לזהות את השינויים האלה ולהשתמש בהם כדי לאבחן מחלות בשלב מוקדם, ובכך להגדיל את סיכויי ההצלחה של הטיפול
לא רחוק היום שבמהלך הפגישה שלנו עם רופא/ה, תפעל ברקע מערכת תומכת החלטה מבוססת בינה מלאכותית שתקשיב לנו – גם למילים וגם לקול עצמו, ותנפיק אבחנות והמלצות. ההמלצות הללו יכללו גם היבט קליני, אבל ניתוח קולי יפתח בפנינו ממד אינפורמטיבי חדש. לדוגמה, ייתכן שבמהלך פגישה עם רופא, מטופל מבוגר יתהה לגבי היכולת שלו לקחת באופן קבוע תרופה מסוימת. החשש הזה יתבטא בשינוי עדין מאוד בקול שלו, בזמן שברמת המילים תשובתו תהיה חיובית. זיהוי כזה יכול להעניק למערכת מידע חשוב שניתן לגזור ממנו פעולות שיגבירו את הסיכויים להצלחת הטיפול – במקרה הזה, להתקשר אליו בעתיד ולהתעניין בדבר לקיחת התרופה, או להעלות את הנושא בפגישה עצמה.
בקולו של המטופל קיים מידע רלוונטי וחשוב שעשוי לסייע לאבחון ולטיפול. ניתוח קולי באמצעות בינה מלאכותית פותח בפנינו את האפשרות להיות קשובים יותר למטופלים (תרתי משמע) ולזקק את המידע הגולמי הטמון בקולם, והוא צפוי להיות כלי מרכזי בארגז הכלים של רופאי העתיד.
נדב לבל, מנהל המרכז לבינה מלאכותית, מערך החדשנות בית חולים בילינסון ומחבר הספר "בינה מלאכותית לבני אנוש"