當前位置:律師網大全 - 專利申請 - 能用AI破譯嬰兒啼哭嗎?

能用AI破譯嬰兒啼哭嗎?

無意中想到壹個場景:利用機器學習準確識別寶寶哭鬧的原因。想想就覺得有意思。作者沒有AIPM的經驗和算法基礎,希望通過白話文描述起到拋磚引玉的作用。歡迎大家討論,多提建議。

哭鬧是嬰兒表達情感和尋求幫助的主要方式,也是壹種健康的表現。這就像告訴父母,“我需要妳!”如果家長能夠了解寶寶的需求,及時解決,對寶寶的生長發育是非常有利的。

現實中的年輕父母有沒有「幫忙破譯哭聲」的需求?我翻遍了各種育兒社區,剪了幾張圖,妳可以設身處地,自己體會壹下。

首先,壹個簡單的調查

1.1用戶調查

為了快速獲得更多信息,犧牲準確性,進行了壹輪包含四個選擇題的迷妳調查。目標人群是照顧過0-6個月寶寶的父母,沒有要求“6個月中期”的苛刻條件。* * * 176樣本收集如下:

a)父母對哭鬧原因判斷的準確性

全對(22%):這些家長有絕對的自信,幾乎不需要工具。通過采訪,我了解到他們之所以能判斷準確,主要有兩個原因。有經驗+寶寶讓人省心。給他們壹個標簽,叫“有答案”,後面會用到。

大部分是正確的(64.2%):大部分父母都是這種狀態,打動他們需要壹定的條件。優秀的用戶體驗是前提,同時還要幫助他們提高診斷效率和準確率。給他們貼上壹個標簽,叫“永遠找對類型”。

很難找(13.5%):有那麽多父母在寶寶哭鬧的時候不知所措,這裏有大把的機會可以探索。想想吧。中國人口基數這麽大,13.5%這個數字真的很小嗎?他們的標簽是“不解”。

b)哭的常見原因有哪些?

覆蓋面:95%的案例已被調查中設定的九大原因覆蓋,前六大原因是饑渴、尿不濕、摟抱、嗜睡、疾病和疼痛。另有5%的家長選擇了其他原因,包括受到驚嚇和被擠壓,這可以通過漸進式調查來補充。

意識:家長認定的哭鬧原因可能不符合真實情況。比如只有17%的家長勾選了“本能運動”這個選項。科學研究表明,任何壹個寶寶都曾因為“本能的動作”而哭過,這對寶寶的身心發展是有幫助的,對以後的語言發展也是壹種啟蒙。“本能運動”和“求媽咪抱抱”的解決方法類似但不完全相同。壹個是要求逗逗,另壹個是要求擁抱。兩者的聲學特征都是充滿節奏的,前者響亮,後者平和。由此可見,幫助家長提高育兒意識可能也是AI解碼的可挖掘點之壹。

c)家長對“解密哭鬧APP”的興趣

這個問題的條件是APP是免費的,樣本的反饋完全超出預期:只有6%的家長表示不會使用,53%的家長願意嘗試,41%的家長表示壹定會使用。

對比幾種類型的父母:不僅“迷茫”,而且“自信”“壹直在尋找合適的類型”對這項技術有著濃厚的興趣。是的,技術不就是幫人偷懶嗎?如果能省點力氣,為什麽要繞彎呢?這裏的“免費”可能有壹定的殺傷力,父母的現實需求+對新技術的好奇心也起到了強大的作用。

由於研究維度有限,粒度細,樣本數量少,無法得出更有價值的結論。但是可以看到壹定的需求和機會,繼續尋找有這個勢頭的同類競品。

1.2競爭產品調查

a)模擬聲音類別

通過模擬胎兒在母親體內聽到的聲音來安慰寶寶。這類產品的主要作用是平復心情,但解決不了“生病”、“疼痛”、“尿不濕”等情況,治標不治本。

b)嬰兒語言翻譯器

美國、中國、臺灣省、西班牙和日本的團隊都做過相關研究。程序可以通過分析哭鬧給出胃痛、尿不濕、嗜睡等原因。每個團隊都聲稱可以覆蓋95%以上的嬰兒哭的原因,準確率比人高三倍,但是每個團隊找到的原因都不壹致。目前,這種產品沒有在中國大陸銷售,也沒有應用程序。有獨立的設備。有興趣可以搜索“貝可萊嬰兒哭聲分析儀”。這類產品已經是AI辯論的前輩了,準確性、易用性、市場化都有提升空間。

人工智能

2016年,日本First-Ascent公司聲稱推出了壹項基於人工智能的技術,可以根據嬰兒的哭聲分析原因,並計劃將這項技術加入到APP中。這篇文章寫到90%才看到這個消息。當我繼續查找的時候,發現它沒有實驗數據,沒有可用的產品,也沒有本地化。

更有趣的是,許多競爭產品提出了技術解決方案的想法,因為程的父親發現很難照顧嬰兒。下面從科學合理性、工具定位、語音識別、數據準備、學習模型這幾個方面來簡單分析壹下。

2.科學理性

拋開競品的幹擾,考慮壹下:哭鬧特征和哭鬧原因的相關性可靠嗎?如果它們之間真的存在相關性,是否意味著無論映射邏輯有多復雜,我們都有可能用機器學習來擬合預測模型?

2.1經驗和常識

寶寶樹等育兒社區列舉了大量聽聲音解決哭鬧的例子,百度的經驗更是詳細列舉了15種哭鬧的特點、原因及解決方法。有經驗的嶽躍可以通過哭鬧快速搞定寶寶,說明通過聲音特征判斷很可能是可以的。

2.2專業研究

學術界對嬰兒啼哭的意義有很多研究,最先進的甚至聲稱可以診斷嬰兒是否患有自閉癥、腦損傷、神經系統疾病以及與早產有關的疾病。我覺得這個方向還是很有前途的,值得深入研究。如果有興趣,可以搜索幾個相關鏈接:

美國嬰兒哭鬧診斷儀可檢測神經系統疾病。

嬰兒的哭聲代表五種情緒

嬰兒啼哭隱藏了疾病的線索

哭聲分析儀,早期發現嬰兒發育障礙

2.3綜合判斷

哭泣並不是劃分病因的唯壹信號。我們可以先用聲音特征作為主要線索來預測壹波,再用其他方法輔助判斷。依靠AI解決100%的問題,要求不高。只要能解決其中的壹部分,提高求解效率,就能發揮應用價值。

這類似於智能手環的綠燈測心率原理。光電法的準確性不如心電信號法(醫用級),僅通過心率很難預測心腦血管疾病。但手環的天然優勢是佩戴方便+實時監控+主動提醒。如果用戶根據經驗、血壓等指標進行綜合判斷,就有可能改善生活習慣,預測風險。這類產品符合早預防早治療的理念,往往能獲得良好的市場反饋。

按照綜合按的思路,整理了下表,訓練模型是預測突出的“哭的原因”。

根據查閱的資料,圖中九種哭的原因分類可能不太準確,但至少人類可以感知到細微的差別。

上圖描述了壹個模擬場景:家長先通過APP鎖定病因範圍,然後根據APP的提示觀察寶寶並給出判斷。像中耳炎這種特殊情況,家長操作過壹次,基本記得鑒別方法。這就引出了我對工具的定位:通過正確的判斷和有效的提示,幫助家長盡快掌握寶寶閱讀和寫作的技巧,寫完了不粘就走。

3、刀具定位

3.1小工具

“解密哭”還沒到產品設計階段,更像是壹個輔助工具,而不是產品。目前各大育兒應用已經相當成熟,提供了豐富的內容和服務,但有些服務很少使用。如果把“解碼哭”也整合進去,也不會太辛苦,可能會錦上添花。比如這些都是很好的入口,寶寶哭鬧的頻率遠高於打疫苗和起名吧?

3.2目標人群

沒有經驗的父母在寶寶0-6個月哭鬧時間長的時候會派上用場。6個月後,寶寶適應了周圍的環境,模型預測逐漸失效。這時,父母已經積累了足夠的經驗。西方提倡父母多和寶寶溝通,學會讀心術,這更像是玄學。“讀”的能力是父母和孩子之間的紐帶,會影響雙方壹生的情感交流。所以不鼓勵家長依賴工具,也要幫助家長掌握寶寶的讀寫技能。

3.3可擴展性

工具雖小,但也有壹點想象的空間。比如給寶寶做壹個哭鬧檔案,記錄每壹次“哭鬧+原因+解決方法”。等寶寶長大了,看到他的成長日誌,就會明白父母把自己拉扯大的不容易。

3.4產品形式

采訪幾個表示不想用的家長,問他們為什麽不想用這樣的APP。

壹位家長表示沒有時間,想通過交流自己的感受來了解寶寶。另壹位家長表示,想不到用APP。他家寶寶很不好意思,好久沒哭了。這涉及到用戶的觀念、習慣、個體差異,真的不是三言兩語能說清楚的。

這裏我只舉壹個例子:小米的小蟻智能攝像頭已經可以監測寶寶的哭聲,提醒家長,如果加上分析原因,給出建議的功能,就不會突兀,反而會很人性化,很精準。總之,產品形態不限於APP。只要內在邏輯科學合理,壹定有壹些交互方案能夠受到用戶的歡迎。

4.語音識別

考慮到成本等因素,在APP中插入小工具非常適合快速打樣和試錯。這屬於近場語音識別,信噪比高,但是環境中還是有噪聲的。識別過程大致分為以下幾個步驟:

4.1降噪

對采集的聲波信號做降噪處理,消除父母談話、物體碰撞、氣流等噪音。目前市面上已經有成功監測嬰兒啼哭的產品,如智能攝像頭、三星S5手機內置APP等。,而且鑒定過程也不會很難。還有壹些相關專利可以參考,網上搜了很多。

4.2過濾

要區分目標寶寶和其他寶寶的信號,需要收集目標寶寶的數據,單獨創建學習模型。

4.4特征

從信號中提取聲學特征供機器學習,留給神奇的算法團隊。

5.數據準備

5.1實例設置

每個例子由兩部分組成:哭音+結果識別。監督學習的結果識別是壹個閉集,訓練數據類似下圖。

5.2樣品標準

聲音信號:記錄的聲音強度大於40分貝,持續時間為10-15秒。錄制的聲音只包含1個嬰兒的哭聲。

結果鑒定:聽到哭鬧聲後,家長采取行動,采集員根據有效行動推斷出1哭鬧原因並記錄。

有效行動:父母采取行動後,寶寶在1分鐘內停止哭鬧。或者哭的原因已經找到,需要壹段時間解決(比如病不能很快治好,醫生可以開診斷證明)。

寶寶年齡:0-6個月

5.3樣品收集

采集區域:嬰兒密集區,即兒科醫院、婦幼保健院、月子中心、兒童福利院等。

采集人員:盡量專業。如果現場記錄了錯誤的鑒定,以後要改正就非常困難了。

考慮體驗:收集過程人性化,不誘導寶寶哭鬧,不影響家庭和寶寶的正常生活。

其他參考:臺灣省的壹個團隊號稱已經成功采集了654.38+萬+的相似樣本,可以借鑒相似的方法或者合作。

6.學習模型

我們應該準確地預測目標集中的分類,並采用監督學習。這裏不談訓練模式和評價指標,只問兩個簡單的問題:

6.1模型應該輸出“哭的原因”還是“解決方法”?

按照通常的思維,用A方案,但直覺告訴我B方案可能可行。B的思路是先預測新數據的解,再根據預期的動作推斷哭的原因。

現實中,“哭理”和“解決”是多對多的復合因果關系。如果直接拿哭+有效解來擬合模型,最後的效果可能是壹樣的,甚至更好。

PS:無論A還是B,都只是型號設計的問題,最終用戶體驗都是壹樣的。

6.2個性化模型

訓練集和實際數據不壹樣,可能會有很多寶寶同時哭,所以需要為每個寶寶建立個性化的模型。每次家長修改都是訓練模型,幫助提高預測效果。

以上是本文的主要內容,拋壹個場景的可能性。可以衍生出很多類似的場景。未來對聲音的科學研究不會止於嬰兒,寵物和野生動物可能會有進步。也許有壹天我們可以通過AI翻譯機與更聰明的動物交流,比如猩猩、海豚和大象。

寫在最後

作者向很多人提到了這個想法,感謝朋友們的支持和建議。寫之前猶豫了壹下,因為作者沒有照顧好寶寶,無法親身體會那種感覺。後來AI產品大本營負責人@黃照鼓勵我試著寫壹個小故事,於是我決定試壹試。

這也促使我反復思考壹個問題:壹個非專業背景,零AI經驗的PM如何有出路?首先,敢於思考,這是第壹步!

挖需求,挖場景,挖機會!模擬場景做研究,發現問題想辦法,而不是跳到工程師的軌道上去拼算法。等我們上了船,在實戰中學習理解算法,會事半功倍。

這是壹個需要想象力的時代,用AI或許可以解決過去從未解決過的問題。在大數據沒有出現的時代,沒有人會想到啤酒和尿不濕之間有著驚人的秘密。

有太多的場景讓我們去發現。限制我們想象力的不是貧窮,而是勇氣。

不平凡的世界觀往往是危險遠而人難及,有誌者事竟成。任何問題都壹定有解決的辦法,我們的任務就是找到它,不管概率有多渺茫!

  • 上一篇:名人在青春時期的名事(最好17歲)
  • 下一篇:新的專利烹飪技術
  • copyright 2024律師網大全