文|白 鴿
編|王一粟
“性價比、降成本、實(shí)用AI”。在亞馬遜云科技2024年度re:Invent大會上,這些詞成為了亞馬遜云科技All in生成式AI的關(guān)鍵詞。
當(dāng)前,大模型行業(yè)整體的風(fēng)向已經(jīng)發(fā)生轉(zhuǎn)變,從原本All in預(yù)訓(xùn)練大模型,逐漸轉(zhuǎn)為不斷收縮預(yù)訓(xùn)練規(guī)模,加速大模型的推理和應(yīng)用。
有位業(yè)內(nèi)人士跟光錐智能表示:“未來全球能夠做通用大模型預(yù)訓(xùn)練的玩家不會超過50家?!?/p>
這也就意味著,越來越多的企業(yè)開始轉(zhuǎn)型做大模型的推理和應(yīng)用落地,而這些玩家最典型的特征,就是會更加注重投入產(chǎn)出比,以及如何通過大模型為自身實(shí)現(xiàn)降本增效。
但大模型的落地應(yīng)用無疑將是一場漫長的戰(zhàn)爭。就像亞馬遜云科技新任 CEO Matt Garman所說:“人工智能是一場沒有終點(diǎn)的競賽,它將永遠(yuǎn)持續(xù)下去?!?/strong>
作為全球云計算廠商的老大哥,生成式AI無疑是亞馬遜云科技不容錯過的賽道。
為滿足更多大模型落地應(yīng)用需求,在這場大會上,亞馬遜云科技全方位展示了從計算、存儲、數(shù)據(jù)庫、推理、人工智能、生成式AI應(yīng)用等方面的體系化更新成果,并已經(jīng)構(gòu)建了從底層AI芯片,到中間大模型平臺,再到上層生成式AI應(yīng)用的完整AI技術(shù)棧和基礎(chǔ)設(shè)施。
通過此次大會也能夠看出,從去年的相對低調(diào),到今年年中的“轉(zhuǎn)穩(wěn)為攻”,再到年尾的“全面開戰(zhàn)”,亞馬遜云科技在生成式AI的這場“無盡”的戰(zhàn)爭中,開始支棱起來了。
此外,亞馬遜首席執(zhí)行官Andy Jassy在演講中也明確了亞馬遜云在生成式AI時代的發(fā)展路徑,“我們一定會優(yōu)先考慮那些真正對客戶重要的技術(shù),專注為客戶解決實(shí)際的問題?!?/p>
也就是說,從真實(shí)客戶需求出發(fā),亞馬遜云科技通過利用自身在基礎(chǔ)設(shè)施、工具/模型和應(yīng)用三層面的積累和實(shí)力,能夠給客戶多提供了一個“快、好、省”的選項。而這無疑能夠讓亞馬遜云科技,再次坐穩(wěn)云計算行業(yè)的“鐵王座”。
全新一代芯片+訓(xùn)練集群,讓大模型訓(xùn)練部署更具性價比
經(jīng)濟(jì)基礎(chǔ)決定上層建筑,云計算的基礎(chǔ)同樣也決定了大模型發(fā)展的未來。
Andy Jassy表示:“當(dāng)生成式AI應(yīng)用達(dá)到一定規(guī)模時,計算成本將至關(guān)重要。”但目前全球范圍內(nèi),大多數(shù)生成式AI應(yīng)用都主要依賴某一種芯片進(jìn)行計算。
因此,行業(yè)希望能夠擁有具有更高性價比的解決方案。
那么,人工智能時代真正的的基礎(chǔ)設(shè)施究竟是什么樣的?亞馬遜云科技高級副總裁Peter DeSantis提出構(gòu)建人工智能基礎(chǔ)設(shè)施的兩個基本支柱:
- 構(gòu)建更強(qiáng)的服務(wù)器;
- 構(gòu)建更大規(guī)模、更高效率的服務(wù)器集群;
而不管是服務(wù)器還是服務(wù)器集群,都離不開最基礎(chǔ)的、高性能的GPU芯片。
Trainium是亞馬遜云科技自研的AI芯片,2020 年首次推出,曾一度被認(rèn)為是訓(xùn)練AI模型最具效率的芯片。在此次re:Invent大會上,亞馬遜云科技宣布Trainium2芯片,以及由Trainium2 驅(qū)動的EC2實(shí)例正式可用,并推出Trainium2 Server和Trainium2 UltraServer,這將使用戶能夠以更高的性能和成本效率訓(xùn)練和部署人工智能模型。
據(jù)介紹,Amazon EC2 Trn2實(shí)例,集成了16個Trainium2芯片,由高帶寬低延遲的NeuronLink技術(shù)實(shí)現(xiàn)互連,單節(jié)點(diǎn)提供20.8 pFLOPS FP8算力,相較GPU實(shí)例,Trn2實(shí)例的性價比高出30%至40%,專為生成式AI訓(xùn)練和推理而構(gòu)建。
在測試中,與其他云服務(wù)商的類似產(chǎn)品相比,使用Amazon Trn2 EC2實(shí)例的Llama 3.1 405B 模型token生成吞吐量提高了三倍以上。
目前,Adobe、Poolside、Databricks、Qualcomm等創(chuàng)新公司已大規(guī)模投入使用Trainium2。
此外,Matt現(xiàn)場還宣布將在2025年推出Trainium3芯片。Trainium3是亞馬遜云科技基于3納米先進(jìn)工藝制造的首款芯片,是Trainium2性能的兩倍,同時能效提升40%。
但面對大模型的訓(xùn)練需求,單一芯片還遠(yuǎn)遠(yuǎn)不夠。亞馬遜云科技通過專有神經(jīng)元鏈接技術(shù)NeuronLink,將64個Trainium2芯片合成了一個Ultra服務(wù)器。其計算容量是現(xiàn)在AI服務(wù)器的5倍。帶寬也是高達(dá)2TB每秒,但延遲只有1微秒。
此外,Anthropic也宣布,下一代Claude模型將在包含數(shù)十萬個Trainium2芯片的Project Rainier集群中進(jìn)行訓(xùn)練。
當(dāng)前,除計算之外,影響大模型訓(xùn)練和推理的,還有存儲和數(shù)據(jù)庫等軟件系統(tǒng)。此次大會上,亞馬遜云科技也同步更新了存儲和數(shù)據(jù)庫體系。
存儲方面,亞馬遜云科技全新發(fā)布Amazon S3 Tables,是專為Iceberg設(shè)計的全新型存儲類別,以應(yīng)對快速增長的數(shù)據(jù)湖需求。
據(jù)介紹,Amazon S3 Tables可提高所有Iceberg表的性能和可擴(kuò)展性。針對存儲在S3中的Parquet文件類型,可獲得3倍的查詢性能及每秒事務(wù)量10倍提升。這使得S3完全重新定義了面向數(shù)據(jù)湖的對象存儲,提供更好的性能、成本和規(guī)模擴(kuò)展能力。
而當(dāng)達(dá)到PB或EB級別存儲規(guī)模時,元數(shù)據(jù)(Metadata)就變得非常重要。元數(shù)據(jù)可幫助組織了解存儲在S3中的對象的信息,從而找到所需的數(shù)據(jù)。
基于此,亞馬遜云科技正式發(fā)布Amazon S3 Metadata服務(wù),可自動從對象中提取元數(shù)據(jù),并近實(shí)時地將其存儲在新的S3Tables桶中(Iceberg表),以支持后續(xù)使用分析工具進(jìn)行元數(shù)據(jù)查詢。當(dāng)對象發(fā)生變化時,S3會自動在幾分鐘內(nèi)更新相應(yīng)的元數(shù)據(jù)。
這無疑解決了大規(guī)模數(shù)據(jù)分析中的元數(shù)據(jù)管理挑戰(zhàn),讓行業(yè)用戶能夠高效發(fā)現(xiàn)和利用數(shù)據(jù)而不必從事重復(fù)性的基礎(chǔ)設(shè)施構(gòu)建工作。
此外,在數(shù)據(jù)庫方面,亞馬遜云科技全新發(fā)布了Amazon Aurora DSQL,其具有免運(yùn)維體驗(yàn)的分布式SQL數(shù)據(jù)庫,可在全球范圍內(nèi)實(shí)現(xiàn)跨區(qū)域部署,并無限擴(kuò)展,具備99.999%的多區(qū)域高可用性及強(qiáng)數(shù)據(jù)一致性,同時兼顧低延遲,是迄今為止最快的全球化部署的分布式SQL數(shù)據(jù)庫,比Google Spanner快4倍。
同時,針對NoSQL數(shù)據(jù)庫,亞馬遜云科技也發(fā)布了Amazon DynamoDB global tables的多區(qū)域強(qiáng)一致性功能。至此,無論客戶需要SQL還是NoSQL,亞馬遜云科技都可以提供在全球可快速擴(kuò)展的高可用數(shù)據(jù)庫,支持?jǐn)?shù)據(jù)強(qiáng)一致支持,并具備極低的讀寫延遲。
對于現(xiàn)階段的云廠商們來說,相比于AI大模型服務(wù),算力無疑是最掙錢的一塊業(yè)務(wù)。但面向未來,AI大模型的服務(wù)和應(yīng)用,也將至關(guān)重要。Jassy在10月份的財報回顧時表示,今年,亞馬遜的云計算業(yè)務(wù)增長態(tài)勢明顯,該公司的人工智能服務(wù)已經(jīng)創(chuàng)造了數(shù)十億美元的年化收入。
自研+集成百余款大模型!選擇的權(quán)利,大于一切
“選擇決定一切!用模型的時候,需要有很多可選的自由!”Andy Jassy在大會上如此說道。
一句話,就已經(jīng)表明了亞馬遜云科技在大模型服務(wù)上的態(tài)度,亞馬遜云科技通過集成更多的大模型產(chǎn)品,來讓用戶在選擇大模型使用上不受限。而這一結(jié)果,也源自于亞馬遜云科技內(nèi)部在做AI應(yīng)用落地的觀察。
“我們驚訝的發(fā)現(xiàn),即使在亞馬遜內(nèi)部,生成式AI應(yīng)用的開發(fā)過程中所使用的模型種類也非常多樣化?!盇ndy Jassy說道,“我們一次又一次地學(xué)習(xí)到同樣的教訓(xùn),那就是——永遠(yuǎn)不會有‘一統(tǒng)天下的工具’。正如數(shù)據(jù)庫領(lǐng)域一樣,我們過去十年一直在討論,人們使用的是多種關(guān)系型或非關(guān)系型數(shù)據(jù)庫?!?/p>
但是,這并不意味著亞馬遜云科技放棄自研大模型產(chǎn)品。
在演講中,Andy Jassy也提到,亞馬遜云科技內(nèi)部在開發(fā)應(yīng)用程序的過程中,內(nèi)部開發(fā)者向亞馬遜的模型團(tuán)隊提出了各種需求,包括希望模型有更低的延遲和更低的成本;望能夠進(jìn)行微調(diào),以通過標(biāo)記樣本進(jìn)一步優(yōu)化應(yīng)用性能;需要更好的圖像和視頻處理能力等等。
這些需求非常廣泛,現(xiàn)如今的大模型廠商并不能完全滿足這些需求。
因此,除集成大模型產(chǎn)品之外,亞馬遜云科技也正式發(fā)布自家新款“大模型全家桶”—Amazon Nova,涵蓋文本對話、圖片生成、視頻生成,未來不僅要實(shí)現(xiàn)Speech to Speech,更要Any-to-Any!
據(jù)介紹,新發(fā)布的Amazon Nova基礎(chǔ)模型共包括四大模型:
- 可用于簡單任務(wù)的超高性價比文字處理Micro模型;
- 三種多模態(tài)模型——低成本的Lite模型;
- 兼具準(zhǔn)確性、速度和成本的Pro模型;
- 用于復(fù)雜的推理任務(wù)同時也可進(jìn)行蒸餾定制的Premier模型。
具體到功能方面,Nova模型支持微調(diào)(Fine-tuning),蒸餾(Distillation)訓(xùn)練更小的模型,讓大模型的使用效率提升的情況下,還能降低成本。同時,Nova模型與Amazon Bedrock知識庫深度集成,可用于RAG,以根據(jù)自己的數(shù)據(jù)生成響應(yīng)。性能層面,Amazon Nova模型與同類模型相比,Nova在所有基準(zhǔn)測試中都是相等或更好,極具競爭力。
現(xiàn)場,Andy也曬出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分?jǐn)?shù)。從成績中不難看出,其在檢索增強(qiáng)生成(RAG)、函數(shù)調(diào)用和智能體應(yīng)用方面具有較好的性能。
同時,亞馬遜云科技還重磅推出兩個全新模型:Amazon Nova Canvas高質(zhì)量圖像生成模型,Amazon Nova Reel高質(zhì)量視頻生成模型。其中,Amazon Nova Reel支持生成六秒的視頻,未來幾個月將支持生成兩分鐘視頻。
在后續(xù)的產(chǎn)品規(guī)劃中,Andy則表示,在2025年一季度左右,亞馬遜云科技將提供語音到語音的模型,允許輸入語音,獲得流暢的語音輸出。在2025年年中左右,將提供多模態(tài)輸入到多模態(tài)輸出的前沿模型,支持文本、語音、圖像及視頻。
目前,亞馬遜云科技自研的大模型產(chǎn)品已經(jīng)上架亞馬遜云科技的“模型工廠”Amazon Bedrock,而Premier版本則將于2025年第一季度推出。
除自研大模型之外,為了能夠讓用戶不受限,亞馬遜云科技數(shù)據(jù)和人工智能部門副總裁 Swami Sivasubramanian在大會上表示:“百款基礎(chǔ)模型隨心挑!亞馬遜云科技宣布推出Amazon Bedrock Marketplace,用戶可以輕松調(diào)用100多款領(lǐng)先的大模型?!?/strong>
目前Amazon Bedrock還上新了包括poolside Assistant、Stable Diffusion 3.5、Luma AI等在內(nèi)的大模型。
隨著大模型的加速落地應(yīng)用,推理也將成為生成式AI工作流中的核心。
Matt在大會上也表示:“推理在AI模型的應(yīng)用中變得尤為重要,尤其是在處理像大型語言模型等復(fù)雜模型時,推理要求極高的計算能力和低延遲響應(yīng)?!?/p>
而為了滿足更多客戶對大模型推理應(yīng)用的需求,此次Amazon Bedrock也迎來多項能力的升級,使得用戶可以通過Amazon Bedrock便捷訪問Inferentia和Trainium芯片提供的推理的硬件優(yōu)化資源。
比如模型蒸餾功能,其能夠提升推理速度高達(dá)500%,成本降低75%,用戶只需提供應(yīng)用示例提示,Amazon Bedrock會為用戶自動完成蒸餾過程,最終獲得一個定制的、具備專業(yè)知識、合理延遲和合理性價比的蒸餾模型。
面對企業(yè)級應(yīng)用,為防止大模型幻覺問題,亞馬遜云科技發(fā)布自動推理檢查功能,有助于檢測幻覺、提供可驗(yàn)證的證據(jù)證明大型語言模型的準(zhǔn)確性。
對于Agent智能體的應(yīng)用,則發(fā)布Amazon Bedrock multi-agentcollaboration(多智能體協(xié)作),可以支持復(fù)雜工作流程。在性能方面,Amazon Bedrock還推出了低延遲優(yōu)化推理,由此,用戶可以在使用最先進(jìn)的大模型基礎(chǔ)上,還享受卓越的推理性能。
數(shù)據(jù)顯示,現(xiàn)在每天都有數(shù)萬名客戶使用Amazon Bedrock創(chuàng)建應(yīng)用程序,比過去一年增長了5倍。而通過Amazon Bedrock,亞馬遜云科技云服務(wù)也實(shí)現(xiàn)既與多家模型提供商有著深厚的合作關(guān)系,同時也集成自研大模型產(chǎn)品,最終能夠?yàn)橛脩籼峁┳顝V泛、最優(yōu)質(zhì)的功能選擇。
開箱即用的AI應(yīng)用,加速大模型落地
有了底層算力基礎(chǔ)設(shè)施的支持,有了可以隨意選擇的大模型平臺工具,但想要真正開發(fā)出一個優(yōu)秀的生成式AI應(yīng)用,卻依然會存在非常多的困難。
不僅需要一個優(yōu)秀的模型,在模型之外,還需要合適的需要合適的安全措施、流暢的語言表達(dá)、良好的用戶界面(UI)以及合理的延遲表現(xiàn)——用戶不希望體驗(yàn)到緩慢或卡頓。此外,還需要一個優(yōu)化的成本結(jié)構(gòu)。
在Andy Jassy看來,在很多情況下,你會覺得自己有了一個很好的模型,稍加開發(fā)就能構(gòu)建出一個優(yōu)秀的生成式AI應(yīng)用。但事實(shí)是,你可能只完成了70%的工作?,F(xiàn)實(shí)是,客戶不會寬容那些仍有30%問題的應(yīng)用。
因此,想要真正開發(fā)一款好用且優(yōu)秀的AI應(yīng)用,離不開云廠商們提供的能夠開箱即用的AI應(yīng)用開發(fā)平臺工具。
亞馬遜云科技的AI應(yīng)用平臺Amazon Q 為用戶提供了豐富的AI應(yīng)用工具。
其中,Amazon Q Developer,此次全新全新推出三個Agent,用于生成單元測試、文檔和代碼審查,可以幫助解決這個開發(fā)人員端到端的開發(fā)問題。
Swami現(xiàn)場表示:“Amazon Q Developer登頂了SWE基準(zhǔn)測試TOP1!輕松解決55.8%的軟件問題,德甲、美國航空、英國電信都在使用。”
Amazon Q Business,可以理解為是亞馬遜云科技為企業(yè)提供的數(shù)據(jù)連接工具,能夠?yàn)槠髽I(yè)數(shù)據(jù)創(chuàng)建了一個索引,連接不同的業(yè)務(wù)系統(tǒng)、企業(yè)數(shù)據(jù)源,無論這些數(shù)據(jù)源來自亞馬遜云科技、第三方應(yīng)用程序,所有這些數(shù)據(jù)都可以在安全和隱私的前提下進(jìn)行更好的搜索,并跨越各種數(shù)據(jù)庫與所有企業(yè)數(shù)據(jù)進(jìn)行對話。
在Q Business之下,亞馬遜此次發(fā)布了將QuickSight和Q Business的數(shù)據(jù)全部結(jié)合的新功能,通過QuickSight和Q Business以及與之相關(guān)聯(lián)的系統(tǒng),例如Salesforce系統(tǒng)數(shù)據(jù)拉入QuickSight報告快速得到更加全面的QuickSight儀表板,使QuickSight作為BI工具變得更加強(qiáng)大。
此外,Amazon SageMaker由于被越來越多客戶用來處理和準(zhǔn)備他們的數(shù)據(jù),用于機(jī)器學(xué)習(xí)的工作負(fù)載。因此,亞馬遜云科技將其重新定位為服務(wù)數(shù)據(jù)、分析和人工智能需求的中心。
全新發(fā)布的Amazon SageMakerUnified Studio,則可以提供整合的數(shù)據(jù)和人工智能開發(fā)環(huán)境,允許客戶訪問組織中的所有數(shù)據(jù),并使用最適合的工具。它能夠?qū)⒛壳皝嗰R遜云科技各種服務(wù),包括Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中獨(dú)立的Studio,查詢編輯器,以及各種可視化工具等,整合到現(xiàn)存的Amazon SageMaker Studio中。
“Amazon SageMaker已經(jīng)成為所有數(shù)據(jù)分析和AI的一站式平臺,分析工作化繁為簡,重新定義了生成式AI的游戲規(guī)則。”Swami如此說道。
目前,在全球范圍內(nèi),各大企業(yè)都希望能夠通過生成式AI實(shí)現(xiàn)降本增效。同時,各大全球企業(yè)巨頭,在研究生成式AI的同時,也會率先在自己內(nèi)部業(yè)務(wù)場景中落地應(yīng)用。
亞馬遜內(nèi)部同樣如此?;谏墒紸I,亞馬遜已經(jīng)將生成式AI落地到企業(yè)內(nèi)部多個應(yīng)用場景中,包括:Alexa 語音助手改造、電商廣告創(chuàng)作、手掌支付、無人值守零售服務(wù)區(qū)和處方藥閱讀等。
而通過內(nèi)部復(fù)雜數(shù)字生態(tài)場景所試煉出來的能力,在輸出給亞馬遜云科技的用戶,無疑將能夠給用戶帶來更好的體驗(yàn)。
綜上來看,此次亞馬遜云科技的重點(diǎn),則落在了大模型的推理和應(yīng)用層面,正在全流程降低生成式AI構(gòu)建的門檻,以及推理和應(yīng)用的成本。
相比于OpenAI對AGI的追求,無疑亞馬遜云科技更注重實(shí)際,而這背后,都離不開其“一切從客戶真實(shí)需求出發(fā)”的技術(shù)研發(fā)準(zhǔn)則。
*前述特定亞馬遜云科技生成式人工智能相關(guān)的服務(wù)僅在亞馬遜云科技海外區(qū)域可用,亞馬遜云科技中國僅為幫助您發(fā)展海外業(yè)務(wù)和/或了解行業(yè)前沿技術(shù)選擇推薦該服務(wù)。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/127687.html