2018蘋果WWDC發布會,你想知道的AI技術都在這里!
原創: Robot Li AI全球總部
蘋果粉的2018蘋果WWDC發布會
6月5日凌晨,2018蘋果WWDC發布會,在世界蘋果粉期盼目光下拉開了序幕。
沒能守住現場直播的朋友,可以看這里。
大會現場Style很蘋果
如果你是買買買的蘋果粉,這次的WWDC發布會恐怕要讓你失望了。
號稱蘋果史上最“軟”發布會,幾乎沒有硬件產品更新,唯一的硬件產品就是“彩虹表帶”。
彩虹表帶
不得不說,這根表帶我很喜歡,甚至沖動想去買一個。
雖然沒有太多硬件更新,但發布了兩個與AI技術相關的應用:一個是Siri,另一個就是圖片管理。
Siri是蘋果公司在其產品應用的一項智能語音控制功能。
Siri變身為一臺智能化機器人,利用Siri用戶可以通過手機讀短信、介紹餐廳、詢問天氣、語音設置鬧鐘等。
應用一:Siri更AI了
不知道有沒有像我這樣的人?沒事的時候總喜歡跟Siri有一搭沒一搭的聊天。
Siri的回答真讓人捉急,真懷疑Siri是不是人工智能的?
不用懷疑,喬幫主已經正面回答過了。
喬布斯在 D8 訪談中被問及蘋果收購 Siri 的原因是否是想與谷歌競爭搜索業務時答曰:他們(指 Siri)不是搞搜索的,他們是搞人工智能的。
喬布斯在 D8 訪談(生前最后一次訪談)
在2018WWDC發布會上,Siri正在發生改變。
依然是庫克站臺
場景①
蘋果Siri 增加了Shortcuts 快捷鍵的功能。
如果你說“Siri,我把鑰匙弄丟了”,它就能通過像Tile這樣的應用程序找到鑰匙。
場景②
Siri可能知道你上班遲到了,因為它知道你通常會在周三早上8點離開家,它還知道你在上午9點開會。
在這種情況下,Siri可能會建議你打電話給老板,讓他們知道你快遲到了。
Siri不再致力于變得“更聰明”,即回答更復雜的問題、與人類進行更自然的對話;
而是開始更多地了解我們如何使用iPhone、如何生活,然后提出建議。
很高興,喬幫主8年前布局的AI語音識別,庫克終于撿起來了。
Siri是語音識別和語義識別的結合
Siri是語音識別和語義識別的結合。
什么是語音識別?
語音識別是把聲音信號轉化為文字。
語音識別
語音識別的原理
語音識別是由語言模型和聲學模型構成的
一套完整的語音識別系統其工作過程分為七步:
①對語音信號進行分析和處理,除去冗余信息。
②提取影響語音識別的關鍵信息和表達語言含義的特征信息。
③緊扣特征信息,用最小單元識別字詞。
④按照不同語言的各自語法,依照先后次序識別字詞。
⑤把前后意思當作輔助識別條件,有利于分析和識別。
⑥按照語義分析,給關鍵信息劃分段落,取出所識別出的字詞并連接起來,同時根據語句意思調整句子構成。
⑦結合語義,仔細分析上下文的相互聯系,對當前正在處理的語句進行適當修正。
什么是語義識別?
語義識別就是試圖理解這些轉化好的文字。
語義識別
語義識別可以分為三層:
①應用層
②NLP技術層
③底層數據層
語義識別的原理
智能語音技術原理中,用戶語音首先被語音識別?轉換為文字?發送至云端服務器?對文字進行語義和語法的識別判斷。
以“我想在辦公室附近找個浪漫點的地方吃意大利菜”為例,智能語音技術在獲得文本后,根據其語法模型進行語法分析。
得出此為一個“主語+謂語+賓語+副詞”的句法結構。
根據這些關鍵信息,智能語音技術按照算法,判斷用戶可能是在尋找一個在自己附近的浪漫的意大利餐廳。
之后,利用服務提供商的搜索引擎搜索,并將結果的文字按照語法進行整合,形成回答。
應用二:用機器學習管理照片
另外,蘋果提升了應用程序的機器學習搜索功能。
蘋果提供了相片的搜索功能,同時還會提供搜索建議,并按時間和地點對事件進行分類,突出重點。
例如關鍵時刻或對你很重要的人、地方和類別,照片中有一個新的 For You 標簽,會提供精選照片效果建議。
可能受Face Book數據泄露事件的影響,蘋果強調實現這樣的操作有一個重大前提:當你使用它們時,公司不會看到你的任何內容。