速途網(wǎng)8月29日訊(報道:喬志斌)今日,通用大模型測評基準SuperCLUE今日發(fā)布了其8月中文大模型榜單。作為中文通用大模型的權(quán)威測評,SuperCLUE每月更新一次,本次榜單推出了全新的評測數(shù)據(jù)集,突顯了模型的十大基礎能力。

不同于以往,8月的SuperCLUE榜單分為五大部分:總排行榜、OPEN多輪開放問題排行榜、OPT三大能力客觀題排行榜、十大基礎能力排行榜以及開源排行榜。本次測評選取了16個最具代表性的通用大語言模型,其中包括國外代表性模型如GPT-4.0、Claude2、gpt-3.5以及Llama-2,雖參與對比但不參與排名。
值得注意的是,Baichuan-13B在8月榜單中脫穎而出,憑借其STF迭代優(yōu)化的第二版,取得了卓越的表現(xiàn),成功登頂國內(nèi)大模型評測榜首。這一成績凸顯了Baichuan-13B在高質(zhì)量數(shù)據(jù)處理和算法優(yōu)化方面的出色能力。
Baichuan-13B在知識問答、生成創(chuàng)作領域展現(xiàn)了出色的表現(xiàn)。在開源排行榜中,Baichuan-13B顯著超越了Llama-2,彰顯了中文領域開源模型的競爭力。
SuperCLUE此次測評揭示出一些重要趨勢:國內(nèi)大模型與國外高參數(shù)量大模型(如GPT-3.5/4等)相比,差距在逐步縮小。以Baichuan-13B為代表的國內(nèi)開源模型在中文領域的競爭力不斷提升,已經(jīng)全面超越了Llama-2。


