然而,上述應用更加傾向于執行,離真正“智”的層面還有一定的距離,以及需要技術進一步突破。就像辦工桌上放著一臺電腦和兩部手機,機器人無法對這3個物體之間的位置關系進行描述。

人工智能部分應用場景

物體場景關系理解
當人類看到同樣的場景時,則可以定性地講出他們之間的位置關系,比如在桌子的中間放著一臺電腦,其中一部手機在電腦的左邊,另一部在電腦的前邊。
人工智能機器人與人類看到的同樣的場景不同的表達,本質區別在于,無法理解兩個甚至多個物體之間存在的糾纏關系,這也是為什么很多深度學習的人工智能機器人“看不懂”物質世界的原因。
如果對物質與物質之間的糾纏關系不了解,就無法真正做到智能,例如幫廚機器人很難執行“將醬油放電磁爐的一邊,然后再將醋拿起來放到另一邊”之類的命令。
為了解決人工智能機器這一應用難題,麻省理工學院科學家研發了一個模型,可以幫助機器理解部分場景中物體與物體之間的潛在關系。
該團隊所研究的模型每次可以表達一個單獨的關系,然后將每次的表達結合起來對整個場景進行描述,進而使得這個模型可以從文字表述中生成更加精準的圖像,相當于在所描述場景中對不同關系的多個單一關系進行排列組合。簡單來說,該團對制備的新模型可以像人類一樣與周圍環境中的物體進行互動。
該研究在未來工業機器人領域具有非常廣泛的應用前景,尤其是針對步驟多、操作復雜的任務。……