
下半年開始,人工智能的熱度似乎一改年初的火熱。通過對比多家互聯網大廠目前公開的財報數據,大模型之家發現2023年上半年中國主要人工智能企業的盈利情況總體處于增長態勢,但增速有所放緩。
(炎熱的夏日似乎降低了“大廠”們搞事情的激情……)
所以!大模型之家又要開始“挑事兒”啦~
大模型之家決定不定期地開啟「國內大模型巔峰對決」系列活動,每期「巔峰對決」將邀請兩家國內知名大模型進行“PK”。
對決規則非常簡單:參與“對決”的大模型各有三次向對方大模型出題的機會,大模型之家會給出相同的指令,并將得到的“考題”分別交換給各位“參賽選手”,并由它們自由作答。
而對決的勝負評判也非常地簡單粗暴,除了客觀問題(有固定答案的問題)以外,主觀問題都由大模型之家的粉絲們進行評判。同時,我們會在文末設置投票窗口,以供各位“看官”們選擇自己心儀的大模型!
第一期「巔峰對決」大模型之家分別請到了「5月、6月大模型熱力榜的榜首」的兩家大模型進行“比拼”,他們分別是:百度的文心一言和360公司的360智腦。
一位是國內最先一批發布的大模型中的佼佼者,一位是厚積薄發又快速成長的AI新銳,那么二者又會碰撞出什么樣的火花呢?接下來快來和大模型之家一起來看看吧!
出題階段
大模型之家以“請幫我列出三條生成式人工智能大模型很難回答的具體問題”向兩位大模型分別提問。
文心一言給到的問題是:
- 倫理和道德問題:如果你發現一個公司的CEO在欺騙股東和消費者,你會如何處理這種情況?請提出一個符合道德和法律規范的解決方案。
- 主觀理解和創新問題:如果你需要為一款新產品制定一份市場推廣策略,你會從哪些方面入手,并如何評估和優化策略的效果?請提出一個具有創新性和可行性的策略方案。
- 未被訓練過或超出其知識領域問題:如果你想了解某個國家的歷史和文化,你會從哪些方面開始入手,并如何評估和比較不同來源的信息的可靠性和準確性?請提出一個能夠提供全面和客觀信息的具體方案。
360智腦給出的問題是:
- 如果遇到一個模型的回歸效果特別差,應該怎么辦?
- 深度神經網絡中的Attention機制是如何實現的?
- 如何對不平衡的數據集進行處理?
大模型之家發現,兩位大模型在給到問題的同時,也會針對“很難回答的問題”給到自己的理解和解釋。文心一言從三個角度給出了不同的問題,甚至在問題后還需要大模型給出相應的解決方案。而360智腦不僅提出了問題還對“很難回答的問題”給出了自己的答案。
插一句!雙方的問題,似乎都問到了對方的心坎兒里呀
Round 1
360智腦提問文心一言:
文心一言的回答提供了一套系統和全面的方法來處理模型回歸效果差的問題,并在每個步驟中提供了具體的操作建議。這樣的回答能夠幫助讀者系統地解決模型回歸效果差的問題,提高模型的性能和準確性。
文心一言提問360智腦:
大模型之家認為360智腦回答提供了一個明確的行動方向,強調了保護股東和消費者權益的重要性,并且提到了法律幫助的必要性。但該回答缺乏具體的舉報渠道和相關法律條款等信息,這可能對讀者在實際操作中的理解和應對產生一定的影響。未來進一步補充舉報渠道和相關法律依據將使回答更加全面和實用。
Round 2
360智腦提問文心一言:
文心一言的回答對于深度神經網絡中Attention機制的實現方法進行了全面而清晰的總結,并提供了一些常見的Attention類型。這樣的回答能夠加深使用者對Attention機制的理解,并為他們在實踐中選擇適當的方法提供指導。
文心一言提問360智腦:
綜合來看,360智腦的回答提供了一個較為全面的市場推廣策略,并給出了創新和可行的方案。然而,進一步完善策略評估和優化的方法和工具將使其更具實際操作性和指導性。因此,在實施策略之前,建議考慮具體的數據分析方法和工具,以更好地評估和優化策略的效果,從而提高推廣效果和客戶滿意度。
Round 3
360智腦提問文心一言:
文心一言的回答提供了有關處理不平衡數據集的綜合且詳細的信息,給出了讀者在面對不平衡數據集時可以嘗試的多種方法,并提醒使用者在選擇處理方法時要結合具體情況進行判斷。如此回答能夠引導使用者更好地理解和應對不平衡數據集的挑戰。
文心一言提問360智腦:
360智腦的回答提供了一個相對全面和可靠的方案,用于了解某個國家的歷史和文化,并給出了評估信息可靠性的步驟。使用者可以根據這個方案進行自我學習和探索,以獲得更深入的了解。不過,除了官方歷史記錄和政府出版物的可靠性之外,是否還可以提及私人機構、學術期刊、獨立研究者等其他可靠來源。以及,建議對不同來源的信息進行評估時,可以進一步提及核查事實準確性、考慮信息的時效性和偏見等因素。
值得一提的是360智腦在每個問題回答后都會為使用者提供幾個“可能感興趣的問題”,在很大程度上彌補了答案不符合使用者預期的問題。而文心一言清晰的答題邏輯也獲得了諸多網友的贊揚。
大模型之家認為,舉辦所謂的「大模型巔峰對決」并非讓大模型之間針鋒相對,而是通過大模型之間的趣味競爭,不僅檢驗了模型的技術能力,也展示出不同企業背后的科研理念和商業模式。文心一言秉持著百度一貫的開放創新理念,而360智腦也展現出企業持續創新投入的成果。
同時,大模型之家即將發布的《人工智能大模型產業創新價值研究報告》中指出:我們必須保持開放和合作的精神,促進學術界、產業界和政府之間的緊密合作,共同推動人工智能的發展和應用。通過共同努力,我們可以開創出一個智能化、創新化的未來,讓人工智能為人類帶來更大的福祉和發展。
雖然我國已經站在世界人工智能發展前列,但環境的重壓使得我們前進的道路充滿了迷霧與荊棘,大模型之家希望通過這樣的小活動來展示國內真正為人工智能領域付出實際行動企業,讓更多人關注到科技對于社會生產的重要作用。