當(dāng)前位置:首頁 > 外匯資訊 > 正文內(nèi)容

谷歌深夜放復(fù)仇殺器Gemini,最強(qiáng)原生多模態(tài)史詩級碾壓GPT-4!語言理解首超人類

激石外匯2023-12-07 11:51:37外匯資訊297

激石Pepperstone(http://wargoo.com/)報道:

谷歌的復(fù)仇大殺器Gemini,深夜忽然上線!

被ChatGPT壓著打了整整一年,谷歌選擇在12月的這一天,展開最強(qiáng)反擊戰(zhàn)。

多模態(tài)Gemini,迄今規(guī)模最大、能力最強(qiáng)的谷歌大模型,在文本、視頻、語音等多個領(lǐng)域超越了GPT-4,是真正的一雪前恥。

人類有五種感官,我們所建造的世界、所消費(fèi)的媒體,都是以這樣的方式所呈現(xiàn)。

而Gemini的出現(xiàn),就是邁向真正通用的AI模型的第一步!

Gemini的誕生,代表著AI模型的巨大飛躍,谷歌所有的產(chǎn)品,都將隨之改頭換面。

塞進(jìn)多模態(tài)模型的搜索引擎、廣告產(chǎn)品、Chrome瀏覽器……這,就是谷歌給我們的未來。

多模態(tài)的史詩級創(chuàng)新

以前,多模態(tài)大模型就是將純文本、純視覺和純音頻模型拼接在一起,就像OpenAI的GPT-4、DALL·E和Whisper那樣。然而,這并不是最優(yōu)解。

相比之下,在設(shè)計(jì)之初,多模態(tài)就是Gemini計(jì)劃的一部分。

從一開始,Gemini就在不同模態(tài)上進(jìn)行了訓(xùn)練。隨后,研究人員又用額外的多模態(tài)數(shù)據(jù)進(jìn)行了微調(diào),進(jìn)一步提升了模型的有效性。最終,實(shí)現(xiàn)了「無縫」地理解和推理各種模態(tài)的輸入內(nèi)容。

從結(jié)果上來看,Gemini的性能要遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有的多模態(tài)模型,而且它的功能幾乎在每個領(lǐng)域都是SOTA級別的。

而這個最大、最有能力的模型,也意味著Gemini可以用和人類一樣的方式理解我們周圍的世界,并且吸收任何類型的輸入和輸出——無論是文字,還是代碼、音頻、圖像、視頻。

Gemini猜對了紙團(tuán)在最左邊的杯子里

Google DeepMind首席執(zhí)行官兼聯(lián)合創(chuàng)始人Demis Hassabis表示,谷歌一直對非常通用的系統(tǒng)感興趣。

而這里最關(guān)鍵的,就是如何混合所有這些模式,如何從任意數(shù)量的輸入和感官中收集盡可能多的數(shù)據(jù),然后給出同樣多樣化的響應(yīng)。

DeepMind和谷歌大腦合并后,果然拿出了真東西。

之所以命名為Gemini,就是因?yàn)楣雀鑳纱驛I實(shí)驗(yàn)室的合體,另外也一個解釋是參考了美國宇航局的Gemini項(xiàng)目,后者為阿波羅登月計(jì)劃鋪平了道路。

首次超越人類,大幅碾壓GPT-4

雖然沒有正式公布,但根據(jù)內(nèi)部消息,Gemini有萬億參數(shù),訓(xùn)練所用的算力甚至達(dá)到GPT-4的五倍。

既然是被拿來硬剛GPT-4的模型,Gemini當(dāng)然少不了經(jīng)歷最嚴(yán)格的測試。

谷歌在多種任務(wù)上評估了兩種模型的性能,驚喜地發(fā)現(xiàn):從自然圖像、音頻、視頻理解到數(shù)學(xué)推理,Gemini Ultra在32個常用的學(xué)術(shù)基準(zhǔn)的30個上,已經(jīng)超越GPT-4!

而在MMLU(大規(guī)模多任務(wù)語言理解)測試中,Gemini Ultra以90.0%的高分,首次超過了人類專家。

Gemini是第一個在MMLU(大規(guī)模多任務(wù)語言理解)上超越人類專家的模型

MMLU測試包括57個學(xué)科,如數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理,旨在考察世界知識和解決問題的能力。

在這50多個不同學(xué)科領(lǐng)域中的每一個中,Gemini都和這些領(lǐng)域最好的專家一樣好。

谷歌為MMLU設(shè)定的新基準(zhǔn),讓Gemini在回答復(fù)雜問題前,能夠更仔細(xì)地發(fā)揮推理能力,相比于僅依賴于直覺反應(yīng),這種方法帶來了顯著提升。

在新的MMMU基準(zhǔn)測試中,Gemini Ultra也取得了59.4%的高分,這一測試包括了跨越不同領(lǐng)域的多模態(tài)任務(wù),這些任務(wù)需要深入的推理過程。

圖像基準(zhǔn)測試中,Gemini Ultra的表現(xiàn)也超過了之前的領(lǐng)先模型,而且,這一成就是在沒有OCR系統(tǒng)幫助的情況下實(shí)現(xiàn)的!

種種測試表明,Gemini在多模態(tài)處理上表現(xiàn)出了強(qiáng)大的能力,并且在更復(fù)雜的推理上也有著極大潛力。

中杯、大杯、超大杯!

Gemini Ultra是谷歌迄今為止創(chuàng)建的最強(qiáng)大LLM最大,能夠完成高度復(fù)雜的任務(wù),主要面向數(shù)據(jù)中心和企業(yè)級應(yīng)用。

Gemini Pro是性能最好的模型,用于廣泛的任務(wù)。它會為許多谷歌的AI服務(wù)提供動力,并且從今天起,成為Bard的支柱。

Gemini Nano是最高效的模型,用于設(shè)備端任務(wù),可以在安卓設(shè)備上本地和離線運(yùn)行,Pixel 8 Pro的用戶就能馬上體驗(yàn)到。其中,Nano-1的參數(shù)為1.8B,Nano-2為3.25B。

Gemini最基本的模型能做到文本輸入和文本輸出,但像Gemini Ultra這樣更強(qiáng)大的模型,則可以同時處理圖像、視頻和音頻。

不僅如此,Gemini甚至還能學(xué)會做動作和觸摸這種更像機(jī)器人的功能!

以后,Gemini會獲得更多的感官,變得更加有意識,更加準(zhǔn)確。

雖然幻覺問題仍然不可避免,但模型知道的越多,性能就會越好。

文本、圖像、音頻精準(zhǔn)理解

Gemini 1.0經(jīng)過訓(xùn)練,可以同時識別和理解文本、圖像、音頻等各種形式的輸入內(nèi)容,因此它也能更好地理解細(xì)微的信息,回答與復(fù)雜主題相關(guān)的各類問題。

比如,用戶先是上傳了一段非英語的音頻,然后又錄了一段英語的音頻來提問。

要知道,一般設(shè)計(jì)音頻的歸納,都是用文字輸入prompt。而Gemini卻可以同時處理兩段不同語言的音頻,精準(zhǔn)輸出所需要的摘要內(nèi)容。

更厲害的是,如果我想做一個煎蛋,不僅可以用語音問Gemini,還可以把手頭有的食材拍個照片一并發(fā)過去。

然后,Gemini就會結(jié)合音頻中發(fā)送的需求,以及配圖中的食材,手把手教你該怎么做好一個煎蛋。

甚至,每完成一步,都可以拍個照片,而Gemini則可以根據(jù)實(shí)際進(jìn)度繼續(xù)指導(dǎo)下一步該做什么。

手癌星人、不會做飯星人都有救了!

而且,這項(xiàng)能力還這使Gemini特別擅長解釋數(shù)學(xué)和物理等復(fù)雜學(xué)科的推理問題。

比如,家長想在輔導(dǎo)孩子作業(yè)的時候省點(diǎn)事,該怎么辦呢?

答案很簡單,直接拍張圖上去,Gemini的推理能力足以解決數(shù)學(xué)、物理等各類理科問題。

針對其中任何一個步驟,都可以追問Gemini來獲得更具體的解釋。

甚至,還可以就出錯的點(diǎn),直接讓Gemini輸出一個和出錯類型相似的題目鞏固一下。

復(fù)雜推理輕松搞定

此外,Gemini 1.0具有的多模態(tài)推理能力,可以更好地理解復(fù)雜的書面和視覺信息。這使得它在發(fā)掘埋藏在海量的數(shù)據(jù)中難以辨別的知識方面具有優(yōu)越的性能。

通過閱讀、過濾和理解信息,Gemini 1.0還能夠從成千上萬的文檔中提取出獨(dú)到的觀點(diǎn),從而助力從科學(xué)到金融等眾多領(lǐng)域?qū)崿F(xiàn)新的突破。

AlphaCode 2:編碼能力超85%人類選手

當(dāng)然,基準(zhǔn)測試終究只是測試,對Gemini的真正考驗(yàn),是想要用它來寫代碼的用戶。

寫代碼,就是谷歌為Gemini打造的殺手級功能。

Gemini 1.0模型不僅可以理解、解釋和生成世界上最主流的編程語言,比如Python、Java、C++和Go的高質(zhì)量代碼。同時它能夠跨語言工作,并對復(fù)雜信息進(jìn)行推理。

從這一點(diǎn)看,Gemini毫無疑問會成為世界領(lǐng)先的編程基礎(chǔ)模型之一。

兩年前,谷歌推出過一款叫做AlphaCode的產(chǎn)品,它也是第一個在編程競賽中達(dá)到具有競爭力水平的AI代碼生成系統(tǒng)。

而基于定制版的Gemini,谷歌推出了更先進(jìn)的代碼生成系統(tǒng)——AlphaCode 2。

在面對不僅涉及編程,還涉及復(fù)雜的數(shù)學(xué)和計(jì)算機(jī)科學(xué)理論等領(lǐng)域的問題時,AlphaCode 2都表現(xiàn)出了卓越的性能。

在與初代AlphaCode同樣的測試平臺上,谷歌的開發(fā)人員也對AlphaCode 2進(jìn)行了測試。

結(jié)果顯示,新模型展現(xiàn)出了顯著的進(jìn)步,解決的問題數(shù)幾乎是之前AlphaCode的兩倍。

其中,AlphaCode 2編程的性能超過了85%的人類程序員,相比之下,AlphaCode只超過了約50%的程序員。

不僅如此,當(dāng)人類程序員與AlphaCode 2協(xié)作時,人類程序員為代碼樣例設(shè)定特定的要求,Alphacode 2的性能會進(jìn)一步提升。

AlphaCode 2的運(yùn)作依托于強(qiáng)大的LLM,并結(jié)合了專為競賽編程設(shè)計(jì)的先進(jìn)搜索和重排機(jī)制。

如下圖所示,新的模型主要由以下幾部分組成:

- 多個策略模型,用于為每個問題生成各自的代碼樣本;

- 采樣機(jī)制,能夠生成多樣化的代碼樣本,以在可能的程序解決方案中進(jìn)行搜索;

- 過濾機(jī)制,移除那些不符合問題描述的代碼樣本;

- 聚類算法,將語義上相似的代碼樣本進(jìn)行分組,以減少重復(fù);

- 評分模型,用于從10個代碼樣本集群中篩選出最優(yōu)解。

更可靠、更高效、可擴(kuò)展

對谷歌來說同樣重要的是,Gemini顯然是一個效率更高、更可靠、可擴(kuò)展的模型。

它是在谷歌自己的張量處理單元上訓(xùn)練的,比谷歌以前的模型(如PaLM)運(yùn)行起來更快、更便宜。

開發(fā)人員使用了谷歌內(nèi)部研發(fā)的張量處理單元TPU v4和v5e,在AI優(yōu)化的基礎(chǔ)設(shè)施上對Gemini 1.0進(jìn)行了大規(guī)模的訓(xùn)練。

而可靠、可擴(kuò)展的訓(xùn)練模型和最高效的服務(wù)模型,就是谷歌做出Gemini的重要目標(biāo)。

在TPU上,Gemini的運(yùn)行速度明顯快于早期規(guī)模較小、能力較弱的模型。這些定制設(shè)計(jì)的AI加速器是谷歌大模型產(chǎn)品的核心。

要知道,這些產(chǎn)品為搜索、YouTube、Gmail、谷歌地圖、Google Play和Android等數(shù)十億用戶提供服務(wù)。它們還幫助了世界各地的科技公司經(jīng)濟(jì)、高效地訓(xùn)練大模型。

除了Gemini,谷歌在今天還發(fā)布了迄今為止最強(qiáng)大、最高效,并且可擴(kuò)展的TPU系統(tǒng)——Cloud TPU v5p,專為訓(xùn)練尖端的AI模型而設(shè)計(jì)。

新一代TPU將加速Gemini的發(fā)展,幫助開發(fā)人員和企業(yè)客戶更快地訓(xùn)練大規(guī)模生成式AI模型,開發(fā)出新產(chǎn)品和新功能。

Gemini,讓谷歌再次偉大?

顯然,在Pichai和Hassabis看來,Gemini的發(fā)布僅僅是一個開始——一個更大的項(xiàng)目即將開啟。

Gemini是谷歌一直在等待的模式,在OpenAI和ChatGPT接管世界后,Gemini是谷歌探索一年得出的結(jié)論。

發(fā)布「紅色警報」后,谷歌一直在追趕,但兩人都表示,不愿意為了跟上步伐而走得太快,尤其是我們越來越接近AGI。

Gemini是否會改變世界?最好的情況是,它能幫谷歌在生成式AI競賽中趕上OpenAI。

但劈柴、Hassabis等人似乎都認(rèn)為,這是谷歌真正偉大的開始。

今天發(fā)布的技術(shù)報告,沒有透露架構(gòu)細(xì)節(jié)、模型參數(shù)或訓(xùn)練數(shù)據(jù)集。

艾倫人工智能研究所前CEO Oren Etzioni說,「沒有理由懷疑Gemini在這些基準(zhǔn)上比GPT-4更好,但沒準(zhǔn)GPT-5會比Gemini做得更好?!?/p>

打造像Gemini這樣的巨量模型,可能需要花費(fèi)數(shù)億美元,但對于在通過云提供AI占據(jù)主導(dǎo)地位的公司來說,最終的回報可能是數(shù)十億甚至數(shù)萬億美元。

「這是一場不能失敗,必須打贏的戰(zhàn)爭?!?????????

掃描二維碼推送至手機(jī)訪問。

版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請注明出處。

本文鏈接:http://wargoo.com/news/2351.html

標(biāo)簽: GPT-4Gemini

“谷歌深夜放復(fù)仇殺器Gemini,最強(qiáng)原生多模態(tài)史詩級碾壓GPT-4!語言理解首超人類” 的相關(guān)文章

美伊兩國今將就恢復(fù)伊核協(xié)議舉行間接磋商,卡塔爾將主持會談

激石Pepperstone(http://wargoo.com/)報道:當(dāng)?shù)貢r間6月27日,美國國務(wù)院一名發(fā)言人表示,美國和伊朗兩國官員將于近日前往卡塔爾首都多哈,就伊核協(xié)議談判舉行間接磋商。伊朗方面證實(shí)了這一消息。 據(jù)路透社6月27日報道,美方表示,伊核協(xié)議談判即將于本周恢復(fù),伊朗需要...

罕見“三重”拉尼娜,極端氣候事件將出現(xiàn)?有哪些影響?

罕見“三重”拉尼娜,極端氣候事件將出現(xiàn)?有哪些影響?

激石Pepperstone(http://wargoo.com/)報道:據(jù)新華社報道,英國《自然》雜志日前稱,氣象學(xué)家已連續(xù)第三年預(yù)測拉尼娜現(xiàn)象,即可能發(fā)生罕見的“三重”拉尼娜氣候事件,可能對全球氣候產(chǎn)生深遠(yuǎn)影響。并且伴隨全球變暖,類似情況可能會更加普遍。 研究人員指出,當(dāng)前拉尼娜現(xiàn)象始于...

新加坡監(jiān)管機(jī)構(gòu):加密貨幣對沖基金三箭資本“提供虛假信息”

激石Pepperstone(http://wargoo.com/)報道:幣圈對沖基金巨頭三箭資本已經(jīng)陷入了破產(chǎn)清算。 禍不單行的是,新加坡金融管理局昨日公開譴責(zé)三箭資本向其提供虛假信息,并且超過了注冊基金管理公司被允許的資產(chǎn)管理門檻。 新加坡金管局是新加坡行使央行職能的政府機(jī)構(gòu),同時也是負(fù)...

外資行紛紛唱多!新興市場能夠抵御美國衰退,中國復(fù)蘇將帶來重大支持

激石Pepperstone(http://wargoo.com/)報道:在40年來最嚴(yán)重的通脹壓力之下,美聯(lián)儲的激進(jìn)“收水”令越來越多投資者擔(dān)憂美國經(jīng)濟(jì)將在不遠(yuǎn)的未來陷入衰退。 高盛此前指出,美國陷入衰退,新興市場會跟著遭殃,但中國股票是亮點(diǎn)。 不同于高盛的觀點(diǎn),摩根大通和德意志銀行等外資...

大幅回升!中國6月財新服務(wù)業(yè)PMI 54.5 創(chuàng)11個月新高

大幅回升!中國6月財新服務(wù)業(yè)PMI 54.5 創(chuàng)11個月新高

激石Pepperstone(http://wargoo.com/)報道:隨著國內(nèi)疫情好轉(zhuǎn),防疫措施放寬,6月份中國服務(wù)業(yè)經(jīng)營活動激增,行業(yè)景氣度大幅升至擴(kuò)張區(qū)間。 7月5日公布的數(shù)據(jù)顯示,中國6月財新服務(wù)業(yè)PMI從5月份的41.4大幅回升至54.5,結(jié)束了連續(xù)三個月的收縮狀態(tài),并升至202...

槍殺安倍嫌犯:行動已謀劃數(shù)月 本打算用自制炸彈殺人

激石Pepperstone(http://wargoo.com/)報道:海外網(wǎng)7月9日電?據(jù)日本電視臺及朝日電視臺9日報道,當(dāng)?shù)貢r間8日,日本前首相安倍晉三遭槍擊后,因傷勢過重不治身亡。槍殺安倍的嫌疑人山上徹也供述,他最初打算用自制炸彈來殺人,并稱此次行動已謀劃數(shù)月。 身為前海上自衛(wèi)隊(duì)隊(duì)員...