文｜白鴿

編｜王一粟

“性價比、降成本、實用AI”。在亞馬遜云科技2024年度re:Invent大會上，這些詞成為了亞馬遜云科技All in生成式AI的關(guān)鍵詞。

當(dāng)前，大模型行業(yè)整體的風(fēng)向已經(jīng)發(fā)生轉(zhuǎn)變，從原本All in預(yù)訓(xùn)練大模型，逐漸轉(zhuǎn)為不斷收縮預(yù)訓(xùn)練規(guī)模，加速大模型的推理和應(yīng)用。

有位業(yè)內(nèi)人士跟光錐智能表示：“未來全球能夠做通用大模型預(yù)訓(xùn)練的玩家不會超過50家?！?/p>

這也就意味著，越來越多的企業(yè)開始轉(zhuǎn)型做大模型的推理和應(yīng)用落地，而這些玩家最典型的特征，就是會更加注重投入產(chǎn)出比，以及如何通過大模型為自身實現(xiàn)降本增效。

但大模型的落地應(yīng)用無疑將是一場漫長的戰(zhàn)爭。就像亞馬遜云科技新任 CEO Matt Garman所說：“人工智能是一場沒有終點的競賽，它將永遠持續(xù)下去?！?/strong>

作為全球云計算廠商的老大哥，生成式AI無疑是亞馬遜云科技不容錯過的賽道。

為滿足更多大模型落地應(yīng)用需求，在這場大會上，亞馬遜云科技全方位展示了從計算、存儲、數(shù)據(jù)庫、推理、人工智能、生成式AI應(yīng)用等方面的體系化更新成果，并已經(jīng)構(gòu)建了從底層AI芯片，到中間大模型平臺，再到上層生成式AI應(yīng)用的完整AI技術(shù)棧和基礎(chǔ)設(shè)施。

通過此次大會也能夠看出，從去年的相對低調(diào)，到今年年中的“轉(zhuǎn)穩(wěn)為攻”，再到年尾的“全面開戰(zhàn)”，亞馬遜云科技在生成式AI的這場“無盡”的戰(zhàn)爭中，開始支棱起來了。

此外，亞馬遜首席執(zhí)行官Andy Jassy在演講中也明確了亞馬遜云在生成式AI時代的發(fā)展路徑，“我們一定會優(yōu)先考慮那些真正對客戶重要的技術(shù)，專注為客戶解決實際的問題?！?/p>

也就是說，從真實客戶需求出發(fā)，亞馬遜云科技通過利用自身在基礎(chǔ)設(shè)施、工具/模型和應(yīng)用三層面的積累和實力，能夠給客戶多提供了一個“快、好、省”的選項。而這無疑能夠讓亞馬遜云科技，再次坐穩(wěn)云計算行業(yè)的“鐵王座”。

全新一代芯片+訓(xùn)練集群，讓大模型訓(xùn)練部署更具性價比

經(jīng)濟基礎(chǔ)決定上層建筑，云計算的基礎(chǔ)同樣也決定了大模型發(fā)展的未來。

Andy Jassy表示：“當(dāng)生成式AI應(yīng)用達到一定規(guī)模時，計算成本將至關(guān)重要?！钡壳叭蚍秶鷥?nèi)，大多數(shù)生成式AI應(yīng)用都主要依賴某一種芯片進行計算。

因此，行業(yè)希望能夠擁有具有更高性價比的解決方案。

那么，人工智能時代真正的的基礎(chǔ)設(shè)施究竟是什么樣的？亞馬遜云科技高級副總裁Peter DeSantis提出構(gòu)建人工智能基礎(chǔ)設(shè)施的兩個基本支柱：

構(gòu)建更強的服務(wù)器；
構(gòu)建更大規(guī)模、更高效率的服務(wù)器集群；

而不管是服務(wù)器還是服務(wù)器集群，都離不開最基礎(chǔ)的、高性能的GPU芯片。

Trainium是亞馬遜云科技自研的AI芯片，2020 年首次推出，曾一度被認(rèn)為是訓(xùn)練AI模型最具效率的芯片。在此次re:Invent大會上，亞馬遜云科技宣布Trainium2芯片，以及由Trainium2 驅(qū)動的EC2實例正式可用，并推出Trainium2 Server和Trainium2 UltraServer，這將使用戶能夠以更高的性能和成本效率訓(xùn)練和部署人工智能模型。

據(jù)介紹，Amazon EC2 Trn2實例，集成了16個Trainium2芯片，由高帶寬低延遲的NeuronLink技術(shù)實現(xiàn)互連，單節(jié)點提供20.8 pFLOPS FP8算力，相較GPU實例，Trn2實例的性價比高出30%至40%，專為生成式AI訓(xùn)練和推理而構(gòu)建。

在測試中，與其他云服務(wù)商的類似產(chǎn)品相比，使用Amazon Trn2 EC2實例的Llama 3.1 405B 模型token生成吞吐量提高了三倍以上。

目前，Adobe、Poolside、Databricks、Qualcomm等創(chuàng)新公司已大規(guī)模投入使用Trainium2。

此外，Matt現(xiàn)場還宣布將在2025年推出Trainium3芯片。Trainium3是亞馬遜云科技基于3納米先進工藝制造的首款芯片，是Trainium2性能的兩倍，同時能效提升40%。

但面對大模型的訓(xùn)練需求，單一芯片還遠遠不夠。亞馬遜云科技通過專有神經(jīng)元鏈接技術(shù)NeuronLink，將64個Trainium2芯片合成了一個Ultra服務(wù)器。其計算容量是現(xiàn)在AI服務(wù)器的5倍。帶寬也是高達2TB每秒，但延遲只有1微秒。

此外，Anthropic也宣布，下一代Claude模型將在包含數(shù)十萬個Trainium2芯片的Project Rainier集群中進行訓(xùn)練。

當(dāng)前，除計算之外，影響大模型訓(xùn)練和推理的，還有存儲和數(shù)據(jù)庫等軟件系統(tǒng)。此次大會上，亞馬遜云科技也同步更新了存儲和數(shù)據(jù)庫體系。

存儲方面，亞馬遜云科技全新發(fā)布Amazon S3 Tables，是專為Iceberg設(shè)計的全新型存儲類別，以應(yīng)對快速增長的數(shù)據(jù)湖需求。

據(jù)介紹，Amazon S3 Tables可提高所有Iceberg表的性能和可擴展性。針對存儲在S3中的Parquet文件類型，可獲得3倍的查詢性能及每秒事務(wù)量10倍提升。這使得S3完全重新定義了面向數(shù)據(jù)湖的對象存儲，提供更好的性能、成本和規(guī)模擴展能力。

而當(dāng)達到PB或EB級別存儲規(guī)模時，元數(shù)據(jù)（Metadata）就變得非常重要。元數(shù)據(jù)可幫助組織了解存儲在S3中的對象的信息，從而找到所需的數(shù)據(jù)。

基于此，亞馬遜云科技正式發(fā)布Amazon S3 Metadata服務(wù)，可自動從對象中提取元數(shù)據(jù)，并近實時地將其存儲在新的S3Tables桶中（Iceberg表），以支持后續(xù)使用分析工具進行元數(shù)據(jù)查詢。當(dāng)對象發(fā)生變化時，S3會自動在幾分鐘內(nèi)更新相應(yīng)的元數(shù)據(jù)。

這無疑解決了大規(guī)模數(shù)據(jù)分析中的元數(shù)據(jù)管理挑戰(zhàn)，讓行業(yè)用戶能夠高效發(fā)現(xiàn)和利用數(shù)據(jù)而不必從事重復(fù)性的基礎(chǔ)設(shè)施構(gòu)建工作。

此外，在數(shù)據(jù)庫方面，亞馬遜云科技全新發(fā)布了Amazon Aurora DSQL，其具有免運維體驗的分布式SQL數(shù)據(jù)庫，可在全球范圍內(nèi)實現(xiàn)跨區(qū)域部署，并無限擴展，具備99.999%的多區(qū)域高可用性及強數(shù)據(jù)一致性，同時兼顧低延遲，是迄今為止最快的全球化部署的分布式SQL數(shù)據(jù)庫，比Google Spanner快4倍。

同時，針對NoSQL數(shù)據(jù)庫，亞馬遜云科技也發(fā)布了Amazon DynamoDB global tables的多區(qū)域強一致性功能。至此，無論客戶需要SQL還是NoSQL，亞馬遜云科技都可以提供在全球可快速擴展的高可用數(shù)據(jù)庫，支持?jǐn)?shù)據(jù)強一致支持，并具備極低的讀寫延遲。

對于現(xiàn)階段的云廠商們來說，相比于AI大模型服務(wù)，算力無疑是最掙錢的一塊業(yè)務(wù)。但面向未來，AI大模型的服務(wù)和應(yīng)用，也將至關(guān)重要。Jassy在10月份的財報回顧時表示，今年，亞馬遜的云計算業(yè)務(wù)增長態(tài)勢明顯，該公司的人工智能服務(wù)已經(jīng)創(chuàng)造了數(shù)十億美元的年化收入。

自研+集成百余款大模型！選擇的權(quán)利，大于一切

“選擇決定一切！用模型的時候，需要有很多可選的自由！”Andy Jassy在大會上如此說道。

一句話，就已經(jīng)表明了亞馬遜云科技在大模型服務(wù)上的態(tài)度，亞馬遜云科技通過集成更多的大模型產(chǎn)品，來讓用戶在選擇大模型使用上不受限。而這一結(jié)果，也源自于亞馬遜云科技內(nèi)部在做AI應(yīng)用落地的觀察。

“我們驚訝的發(fā)現(xiàn)，即使在亞馬遜內(nèi)部，生成式AI應(yīng)用的開發(fā)過程中所使用的模型種類也非常多樣化。”Andy Jassy說道，“我們一次又一次地學(xué)習(xí)到同樣的教訓(xùn)，那就是——永遠不會有‘一統(tǒng)天下的工具’。正如數(shù)據(jù)庫領(lǐng)域一樣，我們過去十年一直在討論，人們使用的是多種關(guān)系型或非關(guān)系型數(shù)據(jù)庫。”

但是，這并不意味著亞馬遜云科技放棄自研大模型產(chǎn)品。

在演講中，Andy Jassy也提到，亞馬遜云科技內(nèi)部在開發(fā)應(yīng)用程序的過程中，內(nèi)部開發(fā)者向亞馬遜的模型團隊提出了各種需求，包括希望模型有更低的延遲和更低的成本；望能夠進行微調(diào)，以通過標(biāo)記樣本進一步優(yōu)化應(yīng)用性能；需要更好的圖像和視頻處理能力等等。

這些需求非常廣泛，現(xiàn)如今的大模型廠商并不能完全滿足這些需求。

因此，除集成大模型產(chǎn)品之外，亞馬遜云科技也正式發(fā)布自家新款“大模型全家桶”—Amazon Nova，涵蓋文本對話、圖片生成、視頻生成，未來不僅要實現(xiàn)Speech to Speech，更要Any-to-Any！

據(jù)介紹，新發(fā)布的Amazon Nova基礎(chǔ)模型共包括四大模型：

可用于簡單任務(wù)的超高性價比文字處理Micro模型；
三種多模態(tài)模型——低成本的Lite模型；
兼具準(zhǔn)確性、速度和成本的Pro模型；
用于復(fù)雜的推理任務(wù)同時也可進行蒸餾定制的Premier模型。

具體到功能方面，Nova模型支持微調(diào)（Fine-tuning)，蒸餾（Distillation）訓(xùn)練更小的模型，讓大模型的使用效率提升的情況下，還能降低成本。同時，Nova模型與Amazon Bedrock知識庫深度集成，可用于RAG，以根據(jù)自己的數(shù)據(jù)生成響應(yīng)。性能層面，Amazon Nova模型與同類模型相比，Nova在所有基準(zhǔn)測試中都是相等或更好，極具競爭力。

現(xiàn)場，Andy也曬出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分?jǐn)?shù)。從成績中不難看出，其在檢索增強生成（RAG）、函數(shù)調(diào)用和智能體應(yīng)用方面具有較好的性能。

同時，亞馬遜云科技還重磅推出兩個全新模型：Amazon Nova Canvas高質(zhì)量圖像生成模型，Amazon Nova Reel高質(zhì)量視頻生成模型。其中，Amazon Nova Reel支持生成六秒的視頻，未來幾個月將支持生成兩分鐘視頻。

在后續(xù)的產(chǎn)品規(guī)劃中，Andy則表示，在2025年一季度左右，亞馬遜云科技將提供語音到語音的模型，允許輸入語音，獲得流暢的語音輸出。在2025年年中左右，將提供多模態(tài)輸入到多模態(tài)輸出的前沿模型，支持文本、語音、圖像及視頻。

目前，亞馬遜云科技自研的大模型產(chǎn)品已經(jīng)上架亞馬遜云科技的“模型工廠”Amazon Bedrock，而Premier版本則將于2025年第一季度推出。

除自研大模型之外，為了能夠讓用戶不受限，亞馬遜云科技數(shù)據(jù)和人工智能部門副總裁 Swami Sivasubramanian在大會上表示：“百款基礎(chǔ)模型隨心挑！亞馬遜云科技宣布推出Amazon Bedrock Marketplace，用戶可以輕松調(diào)用100多款領(lǐng)先的大模型?！?/strong>

目前Amazon Bedrock還上新了包括poolside Assistant、Stable Diffusion 3.5、Luma AI等在內(nèi)的大模型。

隨著大模型的加速落地應(yīng)用，推理也將成為生成式AI工作流中的核心。

Matt在大會上也表示：“推理在AI模型的應(yīng)用中變得尤為重要，尤其是在處理像大型語言模型等復(fù)雜模型時，推理要求極高的計算能力和低延遲響應(yīng)。”

而為了滿足更多客戶對大模型推理應(yīng)用的需求，此次Amazon Bedrock也迎來多項能力的升級，使得用戶可以通過Amazon Bedrock便捷訪問Inferentia和Trainium芯片提供的推理的硬件優(yōu)化資源。

比如模型蒸餾功能，其能夠提升推理速度高達500%，成本降低75%，用戶只需提供應(yīng)用示例提示，Amazon Bedrock會為用戶自動完成蒸餾過程，最終獲得一個定制的、具備專業(yè)知識、合理延遲和合理性價比的蒸餾模型。

面對企業(yè)級應(yīng)用，為防止大模型幻覺問題，亞馬遜云科技發(fā)布自動推理檢查功能，有助于檢測幻覺、提供可驗證的證據(jù)證明大型語言模型的準(zhǔn)確性。

對于Agent智能體的應(yīng)用，則發(fā)布Amazon Bedrock multi-agentcollaboration（多智能體協(xié)作），可以支持復(fù)雜工作流程。在性能方面，Amazon Bedrock還推出了低延遲優(yōu)化推理，由此，用戶可以在使用最先進的大模型基礎(chǔ)上，還享受卓越的推理性能。

數(shù)據(jù)顯示，現(xiàn)在每天都有數(shù)萬名客戶使用Amazon Bedrock創(chuàng)建應(yīng)用程序，比過去一年增長了5倍。而通過Amazon Bedrock，亞馬遜云科技云服務(wù)也實現(xiàn)既與多家模型提供商有著深厚的合作關(guān)系，同時也集成自研大模型產(chǎn)品，最終能夠為用戶提供最廣泛、最優(yōu)質(zhì)的功能選擇。

開箱即用的AI應(yīng)用，加速大模型落地

有了底層算力基礎(chǔ)設(shè)施的支持，有了可以隨意選擇的大模型平臺工具，但想要真正開發(fā)出一個優(yōu)秀的生成式AI應(yīng)用，卻依然會存在非常多的困難。

不僅需要一個優(yōu)秀的模型，在模型之外，還需要合適的需要合適的安全措施、流暢的語言表達、良好的用戶界面（UI）以及合理的延遲表現(xiàn)——用戶不希望體驗到緩慢或卡頓。此外，還需要一個優(yōu)化的成本結(jié)構(gòu)。

在Andy Jassy看來，在很多情況下，你會覺得自己有了一個很好的模型，稍加開發(fā)就能構(gòu)建出一個優(yōu)秀的生成式AI應(yīng)用。但事實是，你可能只完成了70%的工作?，F(xiàn)實是，客戶不會寬容那些仍有30%問題的應(yīng)用。

因此，想要真正開發(fā)一款好用且優(yōu)秀的AI應(yīng)用，離不開云廠商們提供的能夠開箱即用的AI應(yīng)用開發(fā)平臺工具。

亞馬遜云科技的AI應(yīng)用平臺Amazon Q 為用戶提供了豐富的AI應(yīng)用工具。

其中，Amazon Q Developer，此次全新全新推出三個Agent，用于生成單元測試、文檔和代碼審查，可以幫助解決這個開發(fā)人員端到端的開發(fā)問題。

Swami現(xiàn)場表示：“Amazon Q Developer登頂了SWE基準(zhǔn)測試TOP1！輕松解決55.8%的軟件問題，德甲、美國航空、英國電信都在使用?！?/p>

Amazon Q Business，可以理解為是亞馬遜云科技為企業(yè)提供的數(shù)據(jù)連接工具，能夠為企業(yè)數(shù)據(jù)創(chuàng)建了一個索引，連接不同的業(yè)務(wù)系統(tǒng)、企業(yè)數(shù)據(jù)源，無論這些數(shù)據(jù)源來自亞馬遜云科技、第三方應(yīng)用程序，所有這些數(shù)據(jù)都可以在安全和隱私的前提下進行更好的搜索，并跨越各種數(shù)據(jù)庫與所有企業(yè)數(shù)據(jù)進行對話。

在Q Business之下，亞馬遜此次發(fā)布了將QuickSight和Q Business的數(shù)據(jù)全部結(jié)合的新功能，通過QuickSight和Q Business以及與之相關(guān)聯(lián)的系統(tǒng)，例如Salesforce系統(tǒng)數(shù)據(jù)拉入QuickSight報告快速得到更加全面的QuickSight儀表板，使QuickSight作為BI工具變得更加強大。

此外，Amazon SageMaker由于被越來越多客戶用來處理和準(zhǔn)備他們的數(shù)據(jù)，用于機器學(xué)習(xí)的工作負(fù)載。因此，亞馬遜云科技將其重新定位為服務(wù)數(shù)據(jù)、分析和人工智能需求的中心。

全新發(fā)布的Amazon SageMakerUnified Studio，則可以提供整合的數(shù)據(jù)和人工智能開發(fā)環(huán)境，允許客戶訪問組織中的所有數(shù)據(jù)，并使用最適合的工具。它能夠?qū)⒛壳皝嗰R遜云科技各種服務(wù)，包括Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中獨立的Studio，查詢編輯器，以及各種可視化工具等，整合到現(xiàn)存的Amazon SageMaker Studio中。

“Amazon SageMaker已經(jīng)成為所有數(shù)據(jù)分析和AI的一站式平臺，分析工作化繁為簡，重新定義了生成式AI的游戲規(guī)則。”Swami如此說道。

目前，在全球范圍內(nèi)，各大企業(yè)都希望能夠通過生成式AI實現(xiàn)降本增效。同時，各大全球企業(yè)巨頭，在研究生成式AI的同時，也會率先在自己內(nèi)部業(yè)務(wù)場景中落地應(yīng)用。

亞馬遜內(nèi)部同樣如此?；谏墒紸I，亞馬遜已經(jīng)將生成式AI落地到企業(yè)內(nèi)部多個應(yīng)用場景中，包括：Alexa 語音助手改造、電商廣告創(chuàng)作、手掌支付、無人值守零售服務(wù)區(qū)和處方藥閱讀等。

而通過內(nèi)部復(fù)雜數(shù)字生態(tài)場景所試煉出來的能力，在輸出給亞馬遜云科技的用戶，無疑將能夠給用戶帶來更好的體驗。

綜上來看，此次亞馬遜云科技的重點，則落在了大模型的推理和應(yīng)用層面，正在全流程降低生成式AI構(gòu)建的門檻，以及推理和應(yīng)用的成本。

相比于OpenAI對AGI的追求，無疑亞馬遜云科技更注重實際，而這背后，都離不開其“一切從客戶真實需求出發(fā)”的技術(shù)研發(fā)準(zhǔn)則。

*前述特定亞馬遜云科技生成式人工智能相關(guān)的服務(wù)僅在亞馬遜云科技海外區(qū)域可用，亞馬遜云科技中國僅為幫助您發(fā)展海外業(yè)務(wù)和/或了解行業(yè)前沿技術(shù)選擇推薦該服務(wù)。

適合AI的云長什么樣？全球云計算老大哥給了一個答案

全新一代芯片+訓(xùn)練集群，讓大模型訓(xùn)練部署更具性價比

自研+集成百余款大模型！選擇的權(quán)利，大于一切

開箱即用的AI應(yīng)用，加速大模型落地

關(guān)于作者

光錐智能

發(fā)表回復(fù)

適合AI的云長什么樣？全球云計算老大哥給了一個答案

全新一代芯片+訓(xùn)練集群，讓大模型訓(xùn)練部署更具性價比

自研+集成百余款大模型！選擇的權(quán)利，大于一切

開箱即用的AI應(yīng)用，加速大模型落地

關(guān)于作者

光錐智能

增長黑客Growthhk.cn薦讀更多>>

節(jié)點反射支撐，產(chǎn)品和消費者溝通的介紹人與翻譯官

AIGC時代，需要什么樣的云存儲？

喜馬拉雅用戶增長方法探索

精準(zhǔn)粉絲的引流方法

B2B數(shù)字營銷的8個建議｜時光筆記簿

張春宇：淺析用戶增長

發(fā)表回復(fù)

適合AI的云長什么樣？全球云計算老大哥給了一個答案

全新一代芯片+訓(xùn)練集群，讓大模型訓(xùn)練部署更具性價比

自研+集成百余款大模型！選擇的權(quán)利，大于一切

開箱即用的AI應(yīng)用，加速大模型落地

節(jié)點反射支撐，產(chǎn)品和消費者溝通的介紹人與翻譯官

AIGC時代，需要什么樣的云存儲？