Kismet
此條目翻譯品質不佳。 (2018年2月8日) |
Kismet是一款模仿人頭部的機械人,由麻省理工學院的Cynthia Breazeal博士在二十世紀九十年代製作,是研究機器能否辨認和模仿人的情感的一項實驗。 Kismet 一詞來自一個土耳其語單詞,意為「命運」或「好運」。[1]
硬件設計和架構
編輯為了能使Kismet與人類正常地交流互動,它具有聽覺,視覺和本體感受的能力輸入設備。 Kismet通過各種面部的表情,會發聲和移動來模擬人類的情緒。面部表情則是通過耳朵、眉毛、眼皮、嘴唇、下巴和頭部的運動產生的。這些物質材料的成本估計為25,000美元。[1] 此外,還有四個摩托羅拉68332處理器,九個400兆赫的計算機和一個500兆赫的計算機。 [1]
軟件系統
編輯Kismet的社交智能軟件系統(SNS)是按人類智能行為的模型為基礎而設計的。它包含如下六個子系統。[2]
基本特徵提取系統
編輯該系統被用來處理來自相機和麥克風的原始視覺和聽覺信息。 Kismet的視覺系統可以執行眼睛檢測,運動檢測,以及膚色檢測(儘管有爭議)。當Kismet移動頭時,它會暫時禁用其運動檢測系統,以避免檢測自身的運動。它還使用立體相機來估計物體在其視野中的距離,例如檢測威脅 - 迅速移動的大而近的物體。[3]
Kismet的聽覺系統主要是為了識別嬰幼兒講話中的情感。特別的,它可以檢測五種不同類型的情感意圖:批准,禁止,注意,安慰和中立。情感意圖分類器處理步驟如下:從記錄的語音樣本中提取音調平均值和能量(音量)方差等低級特徵。然後將情感意圖的類別建模為高斯混合模型,並使用期望最大化算法將這些樣本進行分類。分類是通過多個階段完成的,首先將一個話語分為兩個一般組(例如安慰/中立與禁止/關注/批准)之一,然後進行更詳細的分類。這種系統架構顯著提高了情感分類的性能,如「批准」(「你是一個聰明的機械人」)與「注意」(「嘿,Kismet,我在這裏」)。
動機系統
編輯Breazeal博士把自己與機械人的關係形容為「像幼兒與看守人的互動,我本人就是看守者,而機械人就像一個嬰兒」。這概述了在一個學習框架內設置的人機關係,Breazeal博士為Kismet的發展提供了支撐。它提供了Kismet能力的展示機會,描述了情緒與表情,表達了機械人的「動機狀態」,Brazeal博士說:「這是一種憤怒(笑)極度的憤怒,厭惡,興奮,恐懼,這是幸福,這是一個興趣,這個是悲傷,驚喜,這個是疲倦,這個在酣睡。[4]
在任何時候,Kismet一次只能處於一種情緒狀態。然而,Breazeal指出Kismet沒有意識,所以沒有觸覺。
語言系統
編輯Kismet用各種各樣的音素說出初始語言,類似於嬰兒的咿呀聲。它使用DECtalk語音合成器,改變音高,時間,發音等來表達各種情緒。語調用於在問題和陳述式的話語之間變化。嘴形同步對現實化很重要,因此開發者使用動畫策略:[6]「簡單是成功的嘴唇動畫的秘訣」。因此,他們並不是完全模仿嘴唇的動作,而是「創造一個不受觀眾挑戰的視覺short hand」。
另見
編輯參見
編輯- ^ 1.0 1.1 1.2 Peter Menzel and Faith D'Aluisio. Robosapiens. Cambridge: The MIT Press, 2000. Pg. 66
- ^ Breazeal, Cynthia. Designing Sociable Robots. The MIT Press, 2002
- ^ Kismet, the robot. [2018-02-08]. (原始內容存檔於2020-10-01).
- ^ Suchman, Lucy. "Subject Objects." Feminist Theory. 2011, pg. 127
- ^ Breazeal, Cynthia. Designing Sociable Robots. The MIT Press, 2002, pg. 112
- ^ Madsen, R. Animated Film: Concepts, Methods, Uses. Interland, New York, 1969