OpenAI公司日前發(fā)布了其文本生成模型GPT-4,引起了人們的廣泛關(guān)注。但該公司表示,開發(fā)人員還不能在上面構(gòu)建任何產(chǎn)品或服務(wù),因為API仍在等待列表中。
這意味著只有少數(shù)用戶有機(jī)會使用OpenAI公司這個最新的大型語言模型。人工智能初創(chuàng)公司Mieeind ehf就是其中之一,該公司是僅有的六家被選中對GPT-4進(jìn)行測試的公司之一。
該公司的一個由12人組成的團(tuán)隊希望通過冰島語訓(xùn)練GPT-4,他們在去年5月前往美國灣區(qū)測試GPT-4之后,成為硅谷這款最熱門產(chǎn)品的早期測試者之一。Mieeind公司的首席執(zhí)行官加入了一個冰島政府代表團(tuán),探索如何利用科技來幫助保護(hù)該國的語言。
Mieeind公司的首席執(zhí)行官與OpenAI公司的Sam Altman對GPT-4如何采用和開發(fā)像冰島語這樣的低資源語言進(jìn)行了探討。這些語言對大型模型語言的全球化應(yīng)用構(gòu)成了挑戰(zhàn),這是因為用于訓(xùn)練模型所收集的數(shù)據(jù)要少得多。
Mieeind公司的團(tuán)隊為此提出了他們對GPT-4如何改進(jìn)的看法,人工智能用來保護(hù)冰島語的萬年歷,以及GPT-4如何為貓創(chuàng)造出一個非常有趣的新術(shù)語。
令人興奮的發(fā)展
Mieeind公司的這個團(tuán)隊的任務(wù)是,通過向GPT-4輸入冰島語強(qiáng)化學(xué)習(xí)數(shù)據(jù)(初始訓(xùn)練之后的階段),了解是否能提高GPT-4在語言應(yīng)用和處理方面的表現(xiàn)。
Mieeind公司的機(jī)器學(xué)習(xí)團(tuán)隊成員之一Pétur Orri Ragnarsson表示,其結(jié)果在GPT-3.5上有了明顯的改進(jìn),但當(dāng)涉及到冰島語的使用時,這個模型仍然不完美。他說,“它用冰島語生成的文本往往是可以理解的,但仍然有一些語法錯誤?!?/p>
Ragnarsson表示,他可以看到GPT-3.5在一般的推理方面有巨大的改進(jìn)。
他說:“最令人興奮的是,可以要求它做一些事情,并解釋為什么它會給出這個結(jié)果。GPT-3.5可以做到,GPT-4更好,因為這讓人們感覺它的解釋更合理或更可信。人們通常嘗試的一件事是讓GPT-4做一些事情,并解釋過程中的每一步——它做得非常好?!?/p>
“可解釋性”是開發(fā)生成式人工智能的人一直試圖解決的一大問題,因為大型語言模型的功能方式意味著輸出是在“黑箱”中生成的。這意味著即使是構(gòu)建GPT-4的開發(fā)人員也不知道它是如何回答問題的,這意味著很難讓這些模型展示它們的工作原理。
如果生成式人工智能要在醫(yī)療和法律等行業(yè)得到廣泛應(yīng)用,那么在這些領(lǐng)域工作的人需要能夠信任模型的輸出。
高階思維
讓Ragnarsson印象深刻的GPT-4的另一個特點是,它能夠產(chǎn)生比以前的模型更敏銳的反應(yīng)。他舉了一個例子,用它來對一段文字進(jìn)行情緒分析,其評價從中性到積極,評分從1到5分。
Ragnarsson說:“我輸入了一段我認(rèn)為相當(dāng)中性的一句話,也就是一位客戶向客服詢問一些事情?!彼@訝地發(fā)現(xiàn),GPT-4對這句話的評價是略微積極。
他說,“我問,‘請解釋一下?!玫降拇鸢阜浅A钊梭@訝。它說,‘雖然這句話本身是中立的,但正在考慮的行動將會改善他們的生活,所以從整體上看,這一句話是略微積極的?!?/p>
他認(rèn)為,這表明GPT-4已經(jīng)學(xué)會了超越文本的“表面含義”。
Mieeind公司的首席運(yùn)營官Linda Heimisdottir說,GPT-4的這些能力尤其令人印象深刻,因為據(jù)她所知,這個模型并沒有專門訓(xùn)練過情感分析。
她說:“看到這樣一個模型做了研究人員多年來一直在做的事情,而且它沒有專門受過這方面的訓(xùn)練,這令人驚嘆??吹剿某晒腿藗兊南敕ㄕ娴暮芰钊伺d奮,這讓人們覺得GPT-4有著巨大的應(yīng)用潛力?!?/p>
勤奮的貓
GPT-4如何采用冰島語的一個例子來自于該語言使用的復(fù)合詞,復(fù)合詞是將不同的概念組合成一個詞。
Heimisdottir表示,她讓GPT-4講一個關(guān)于貓的故事,GPT-4給出了一個冰島語單詞,“kattafr?eilega”,這是GPT-4發(fā)明的一個合成詞,其大致的意思為“cat”(貓)。
她解釋說:“第一部分‘katta’是‘cat’的意思,但第二部分‘fr?eilega’的意思是‘與理論有關(guān)’。GPT-4描述這只貓是‘kattafr?eilega duglegur’。duglegur是一個冰島詞,意思是勤奮或努力工作。
當(dāng)我讓GPT-4解釋它的意思時,它說:‘kattafr?eilega duglegur’意味著這只貓?zhí)貏e勤奮。換句話說,它擅長抓撓、調(diào)查、追逐昆蟲、尋找食物,對周圍環(huán)境充滿活力和興趣。它很擅長做一只貓。”
Mieeind認(rèn)為,“對于大型語言模型來說,要在較少使用的語言中實現(xiàn)真正的高性能,需要在初始訓(xùn)練中包含良好的多語言數(shù)據(jù)集,我們希望下一步可以進(jìn)入預(yù)訓(xùn)練?!?/p>
像這樣的研究對確保下一代人工智能不僅僅是進(jìn)一步集中在英語世界的創(chuàng)新進(jìn)步至關(guān)重要,因為硅谷的大型科技公司已經(jīng)主導(dǎo)了大型語言模型領(lǐng)域。事實上,OpenAI公司選擇Mieeind公司作為GPT-4的早期測試廠商,至少表明該公司對生成式人工智能具有全球視野,即使這是出于商業(yè)動機(jī)。