圖/美聯社
自從OpenAI 開發的ChatGPT在全球爆紅後,人工智慧(AI)競賽已然開打,Facebook母公司Meta於18日宣布推出第三代大語言模型(LLM)Llama 3,強碰ChatGPT、Gemini和Claude 3等對手,此外,Meta也宣布基於Llama 3升級了AI助理Meta AI。
Meta於去年7月發布Llama 2,為開源AI語言模型,與OpenAI的ChatGPT和Google的對話式AI服務Bard展開競爭。時隔九個月,Meta推出了新一代模型Llama 3,將在亞馬遜、微軟、Google雲端等平台啟用,且獲得輝達(Nvidia)等晶片巨頭和戴爾(Dell)的硬體支援。
據Meta介紹,Llama 2有三個版本,最大版本70B的參數規模為700億,而新一代的Llama 3則有8B(80 億參數)和70B(700 億參數)兩個版本,未來更大版本的Llama 3將有超過4,000億參數,目前仍在接受訓練,至於是否會開源則尚未做出最終決定
Llama 3與前一代另一不同之處在於,Llama 2使用2兆個token進行訓練,而Llama 3 最大版本則有超過15兆個token,全部從公開來源收集、投入訓練,不過Meta並未針對具體資料來源多談。
Meta指出,Llama 3 8B和70B版本在許多面向的評估分數都高於Google的Gemma和Gemini以及Anthropic的Claude 3,包含大規模多任務語言理解資料集(MMLU)、研究生程度專家推理(GPQA)、數學評測集(GSM8K)、程式設計多語言測驗(HumanEval)等方面。
有了新一代Llama的助力,Meta 也宣布升息了Meta AI,藉由導入Llama 3,將使Meta AI有更快反應速度,不僅能提升影像生成速度,也能處理動態GIF圖檔