補課的盡頭是科大訊飛(圖)
【看中國2023年10月27日訊】程序員們不能沒有1024,就像西方不能沒有耶路撒冷。這幾年,科技都喜歡在10月24日開發布會,解釋起來也不複雜,說1024是組成4個十進位數字的最少二次方數,在電腦語言裡有非凡的意義。
當然,有些網站間隔1024秒才能再發帖的也可以算在內。
10月24日,科大訊飛創始人劉慶峰在體育場裡發布了自己最新一代的星火大模型。據他說,星火3.0大模型中文能力客觀評測超越ChatGPT,英文能力對標ChatGPT4 8項任務結果相當。所以:綜合能力已超越ChatGPT。
劉總說話,咱一向是完全相信的。但畢竟,他們也曾經出過「訊飛聽見」後面的真人同聲傳譯員發文說我不是AI這種事。所以,筆者試著問了ChatGPT和星火相同的幾個問題,包括雞兔同籠、旅行安排、名人簡介、代碼等。
這些問題使用的都是中文,前面三個問題我們沒有比較出明顯的優劣,到了最後一個代碼問題的時候,ChatGPT大概用了10秒就給出了答案。星火則一連被問了三次,也沒吭聲。
此前,科大訊飛說星火2.0相比ChatGPT在代碼功能上,差距只有1%。小半年過去了,2.0都變成3.0了,這1%的問題怎麼還沒解決?
對於俺的疑問,科大訊飛的朋友倒是有一番說法:你不能用幾個問題來評價大模型的好壞。
巧了,今天有一則新聞爆出,用戶從另一方面評價了大模型。
有家長說,在自家孩子的科大訊飛學習機中的《藺相如》一文裡,發現了一些「詆毀偉人、扭曲歷史」等違背主流價值觀的內容。劉慶峰在百忙之中回應了這個問題,他說這是合作夥伴提供的內容,第一時間已經下架了,同時,內部已經將用於大模型的內容審核機制放到了學習機上,以後的學習機內容審核會更加嚴格。當然,劉總還不忘說一句:「負面輿情有推手」。
科大訊飛學習機中經由AI提供的內容驚現所謂「詆毀偉人、扭曲歷史」的內容(網路圖片)
三令五申要減負大家就是不聽,關鍵時刻還是要靠劉總搞搞新意思。這個消科大訊飛息一出,正在辦喜事的股價直接跌停。媒體們就這個最新的跌停分析了很多,甚至還把劉總8月份拋售4000萬股自家股份套現幾十億,獲利75%的事情也說了一遍。
劉總說「負面輿情有推手」,你們在暗示什麼?
負面輿情有沒有推手咱不知道,但星火的對手俺還是瞭解一些的。
ChatGPT 3.0訓練一次的成本是140萬美元,而且隨著參數樣本量增加,成本也會增加。算上伺服器等各方面投入,第一階段就要砸8億美元。而GPT-4就更燒錢了——坊間傳聞,一次訓練的費用大概在6400萬美元左右。
按道理說,科大訊飛的星火既然綜合能力已經超過了ChatGPT,那投入應該也是相當大的吧?翻了翻科大訊飛的財報,今年上半年,科大訊飛研發投入相比去年同期增加了:人民幣9000萬。
而且,科大訊飛全年研發投入也就20多個億。那麼,問題的真相只能有兩個,要麼科大訊飛找到了「花小錢辦大事」的路子,要麼就是那邊OpenAI內部有人搞貪污。
所以,這邊建議OpenAI的紀委趕緊介入查一查吧。
(文章僅代表作者個人立場和觀點)