近日,谷歌正式推出了Gemini 2.5系列,其中實(shí)驗(yàn)版Gemini 2.5 Pro在多項(xiàng)基準(zhǔn)測(cè)試中均展現(xiàn)了最先進(jìn)水平,并以顯著優(yōu)勢(shì)登頂LMArena排行榜首位。
Gemini 2.5系列的一大亮點(diǎn)在于其具備的思維鏈推理能力。在處理任務(wù)時(shí),該模型會(huì)先進(jìn)行系統(tǒng)化思考推演,類似于人類面對(duì)復(fù)雜問(wèn)題時(shí)的深入分析方式。這種思考方式使Gemini 2.5系列在性能提升和準(zhǔn)確性增強(qiáng)方面取得了顯著成效。
Gemini 2.5 Pro作為該系列的重要版本,支持多種輸入模式,包括文本、圖像、音頻、視頻以及代碼,能夠輕松解析各種類型的信息。其上下文窗口高達(dá)100萬(wàn)token,相當(dāng)于約75萬(wàn)單詞,足以解析長(zhǎng)篇巨著。谷歌還計(jì)劃進(jìn)一步升級(jí)這一能力,將上下文窗口擴(kuò)大至200萬(wàn)token,以在處理跨模態(tài)復(fù)雜問(wèn)題時(shí)展現(xiàn)出更大優(yōu)勢(shì)。
目前,Gemini 2.5 Pro已正式登陸谷歌AI Studio開(kāi)發(fā)平臺(tái)及Gemini應(yīng)用生態(tài)中的Gemini Advanced用戶專區(qū),支持移動(dòng)端與桌面端。開(kāi)發(fā)者與企業(yè)用戶可以立即接入體驗(yàn)這一強(qiáng)大的模型,并將其應(yīng)用于智能客服、數(shù)據(jù)分析、內(nèi)容創(chuàng)作等多種實(shí)際場(chǎng)景中。
值得一提的是,Gemini 2.5 Pro在不采用增加計(jì)算成本的測(cè)試階段技術(shù)(如多數(shù)投票)的情況下,已在GPQA(通用問(wèn)題解答評(píng)估)與2025年AIME(國(guó)際數(shù)學(xué)邀請(qǐng)賽)等數(shù)學(xué)與科學(xué)類基準(zhǔn)測(cè)試中排名榜首,展現(xiàn)了其卓越的高級(jí)推理能力。