2023年真是不平凡的一年!短短365天,我們見證了生成式AI的寒武紀大爆發,國內外大大小小的基礎模型、大模型產品令人眼花繚亂,各大科技公司憑借技術、人才、資金等優勢,開始集中力量投入到模型研發、平臺搭建、工具提供等,希望通過AI技術的引入實現商業化創新。
在新技術浪潮下,大語言模型的快速迭代,帶動了語義理解、圖像生成和數據分析等相關技術的發展,讓文生文、文生圖、文生表、圖生圖、圖生文、視頻生文、文生視頻等應用,逐漸向企業關鍵業務領域滲透。現在,整個社會、各個行業和企業,都在思考如何把生成式AI技術用好,為產業升級和數字化轉型賦能。
當 “百模大戰”升級到“千模大戰”,廣大用戶及開發者關注的不是大模型的參數達到了怎樣一個量級,而是如何以更便利的方式快速上手,把想要的模型與企業業務結合,這是“2023亞馬遜云科技re:Invent中國行”的使命所在,就是希望從全球戰略、技術角度探討生成式AI的應變之道,把最好的產品和體驗帶給中國客戶。
2023年12月12日,re:Invent中國行北京站盛大開啟,大會現場座無虛席,人氣持續火爆。無論是主會場,還是場外的展區,都能看到參會者認真而專注的神情。就內容而言,re:Invent北京站全面展示了全球大會的最新產品和技術、前沿趨勢以及相關實踐。作為云計算領域的開拓者和創新者,亞馬遜云科技多次提到一個關鍵詞叫做 “重塑”,從底層、平臺層到最上面的應用層,云計算正在以前所未有的顛覆力構建全棧生成式AI能力,為用戶提供卓越體驗。
當智能數字業務走向深水區
從應用變化的角度來看,生成式AI之所以觸發科技的轉折點,遵循的是“大模型摩爾定律”。雖然,新世界還沒有到來,但生成式AI的未來已至。之后,企業IT基礎架構也會跟著發生化學反應。巨大算力增長背后其實是底層服務器、芯片、數據等重要能力的升級,而云正在重塑一切。
大模型如火如荼背后,底層的芯片、到中間的平臺再到上層的應用,都與過去不同。如果企業繼續采用傳統的IT架構,CPU和加速器之間的接口會限制產品的性能水平,也就無法更好地支持生成式AI時代的新需求。與此同時,由AI模型帶來的大量資源消耗,也是企業關注的重點問題。所以,滿足未來需求的企業架構設計,一定會充分考慮到成本和可持續發展問題。
進一步講,生成式AI不能單獨創造價值,其工作負載的計算密集程度非常高,它需要底層更強大的硬件支持。因此,具有擁有高性價比的基礎設施,是應用成功構建的關鍵要素之一。
另外,智能化系統之所以更具顛覆性,是因為在感知、理解、學習、推理、交互等方面具有更廣泛的適應性,以及更友好的多模交互能力。所以,在架構設計上要充分考慮到可行性、可控性和通用性,才能滿足多場景、多需求、多任務之間的快速切換。
智能化系統并不是只有一個大模型,架構設計者需要在根據不同業務場景的需求進行偏好對齊,具備多模索引、模型選擇、模型算力調度和模型推理的能力。比如:有的大模型是和員工的生產力、工作效率相關。有的大模型則和智能化水平相關,包括營銷、客服、HR、財務。有的是專屬應用場景,比如金融領域的欺詐、醫療領域的病例生成,以及供應鏈管理等。企業要根據不同需求,以及不同技術支撐能力,選擇適合的智能化架構升級路線。
而儉約云架構可以憑借天然優勢,快速落地生成式AI所需要的一切能力,借助專門構建的工具和底層基礎設施,可以快速搭建高性價比應用,體驗到開箱即用的效果。
三層生成式AI架構讓用戶實現“模型自由”
為了進一步降低利用生成式AI的門檻,幫助客戶更輕松、安全地構建應用。亞馬遜云科技推出了三層架構,包括用于基礎模型訓練和推理的基礎設施、使用基礎模型進行構建的工具,以及利用基礎模型構建的應用程序。
1、底層:提供用于基礎模型訓練和推理的基礎設施
生成式AI在激發人類的智慧和創造力,也會帶來一系列的挑戰。比如:如何兼顧規模和成本?如何選擇適合的模型,保證自身業務的安全性和隱私?包括如何利用私有數據去訓練模型,讓生成式AI成為所在領域的技術專家?
所以,從關注性能、成本和經濟效益的底層開始,亞馬遜云科技在13前年就看到了加速計算芯片帶來的價值。亞馬遜云科技是第一家把GPU帶人云端的供應商,現在GPU服務器已經廣泛用于HPC、視頻、AI工作負載等等多種應用領域。
如今,亞馬遜云科技不僅提供了通用GPU芯片,還推出了專門用于訓練和推理的芯片。最新發布的Amazon Trainium2處理器,可針對具有數千億至數萬億參數的基礎模型進行訓練優化,相較 Amazon Trainium 4 倍性能提升,能夠達到65 ExaFLOPS的按需超級計算性能。同時,最新發布的Amazon SageMaker HyperPod 服務,可大規模加速基礎模型訓練,能夠縮短高達40%的訓練時間,并可以確保持續數周或數月的訓練過程不中斷。
除了自研芯片,亞馬遜云科技也在選擇與優秀的合作伙伴合作,為用戶提供基礎架構的多種選擇。在本次re:Invent 2023全球大會上,亞馬遜云科技和英偉達共同宣布了幾項最新合作:1)亞馬遜云科技將提供首款搭載NVIDIA Grace Hopper超級芯片和亞馬遜云科技UltraClusters技術的云AI超級計算機;2)首款使用NVIDIA最新芯片GH200 NVL32 的NVIDIA DGX云即將登錄亞馬遜云科技;3)兩家公司共同開展“Project Ceiba”合作項目, 將全球最快的GPU驅動AI超級計算機和NVIDIA DGX云超級計算機用于NVIDIA AI的訓練、研發、定制化模型的開發。
2、中間層:提供使用基礎模型進行構建的全托管服務
對于客戶來說,大模型需求千變萬化,但無需把每個模型都重新開發一遍,選擇錯誤的模型技術路線,會極大地消耗企業的精力,無法擁抱快速變化的世界。
選擇平臺化的工具, Amazon Bedrock是利用大模型構建和擴展生成式人工智能應用的最簡單方法。各行各業的客戶已經在使用Amazon Bedrock 重塑他們的用戶體驗、產品和流程,并將人工智能帶入他們的業務核心。
Amazon Bedrock不僅提供了亞馬遜云科技自研的Amazon Titan,還可以通過API調用等方式,輕松訪問AI21 Labs、Anthropic、Cohere、Meta、Stability AI等眾多主流第三方模型,來重構業務、提升用戶體驗。
Amazon Bedrock最新發布可支持Anthropic Claude 2.1和Meta LLama 2 70B。Claude 2.1為企業提供了先進的關鍵功能,包括業界領先的200K標記上下文窗口,與此前模型相比,Claude 2.1 在開放式對話中的錯誤陳述減少了50%。支持 Meta 的 LLama 2 70B,適用于大規模任務,如語言建模、文本生成和對話系統。
能為企業真正創造價值的生成式AI,有一個關鍵點,就是能夠用企業自己的數據進行定制,構建差異化壁壘。所以,在Amazon Bedrock 中,有一種自定義模型的方法就是持續預訓練,這是一種使用大量未標記數據(如內部報告、財務計劃或研究成果的原始文本)來提高基礎模型對特定領域的知識和推理能力的技術,這種方式是適合想要擁有“領域大模型”,或者說將領域知識以及技能嵌入大模型能力的場景。同時,微調是另外一項重要模型定制技術,經常被用來控制模型去理解特定的輸入格式(比如:固定問問題的問法),輸出以及理解回答問題的角色。然后,Amazon Bedrock 會復制一個客戶專屬的基礎模型,并結合客戶準備的S3上的數據,進行微調,并生成一個新的定制模型。最后,RAG檢索增強,可能是現在最常見的用企業數據定制的方式。知識庫功能可將模型安全地連接到公司內部數據源,并通過RAG檢索增強生成的方式,為聊天機器人或問答系統等應用,提供更準確的回答。
有了模型和定制能力,還需要和應用集成才能服務于業務。最新發布的Amazon Bedrock 代理功能,可以使生成式AI應用跨公司系統和數據源執行多步驟任務。通過代理功能,客戶在進行訪問權限等簡單設置后即可用自然語言編寫要求,隨后代理即可自動分析請求并將其分解為邏輯序列,以及采取相應的行動。
值得一提的是,亞馬遜云科技自研模型Amazon Titan,是用戶關注的大模型重點應用?;?5年人工智能和機器學習經驗,Amazon Titan可支持多種用例。而借助Amazon Titan Text Embeddings,可以讓用戶把本文轉化成向量,讓模型更容易找到相似單詞的距離。
與Amazon Titan相關的各種創新,還有很多,可以讓用戶實現更復雜場景的應用。比如:新發布的Amazon Titan Text Lite 是一種更小巧、更具成本效益的模型,可以支持聊天機器人問答或文本摘要等用例。它最大的特點是,重量輕,非常適合微調,為業務需求提供高度可定制的選擇。而Amazon Titan Text Express 模型參數量更大,可用于更廣泛的任務,如開放式文本生成和對話聊天。Amazon Titan Multimodal Embeddings多模態嵌入模型,能夠創建更豐富的多模態搜索和推薦體驗。Amazon Titan Image Generator圖像生成模型預覽版,現已推出預覽版,使客戶能夠使用自然語言提示生成高質量、逼真的圖像或增強現有圖像。
3、頂層:提供利用基礎模型構建的應用程序
如果想讓用戶更深度地使用生成式AI,有沒有一種開箱即用的解決方案?
首先,亞馬遜云科技還提供了生成式AI助手Amazon Q。Amazon Q專門為了數字化工作場景而設計,它可以通過自然語言交互來快速獲得答案,生成內容并采取行動。同時,做負責任的AI理念體現在每一款產品設計中, Amazon Q是通過用戶現有的身份和訪問權限來進行訪問,用戶在目前應用環境下,他們能擁有什么樣的權限,會完全按照這樣的權限來進行訪問。Amazon Q可使用身份驗證系統來確認用戶職能和訪問權限,并支持指定話題屏蔽或關鍵詞過濾等管理控制功能。
Amazon Q是企業級生成式AI領域的殺手锏級應用,由亞馬遜云科技17年來積累的知識和經驗訓練而成,可以在多種界面回答客戶提出的各種亞馬遜云科技相關的專業問題。Amazon Q可以在Amazon CodeWhisperer中回答開發人員的各種代碼相關的問題并附上可一鍵實施的代碼,并提供代碼轉換功能,可以將應用維護和升級時的代碼轉換所需時間從幾天縮短至幾分鐘。
Amazon Q也是業務人員的“數字化助手”,它擁有40多個兼容流行數據源的內置連接器,并支持自定義連接器,企業可以輕松將其連接至其業務數據和系統中。Amazon Q可支持引入多種企業級服務,包括可以引入BI應用到Amazon QuickSight中,它能夠在幾秒鐘內響應用戶要求,創建精準且美觀的月度業務變化的相關描述,該功能現已提供預覽。Amazon Q也是聯絡中心專家,用戶可將Amazon Q引入云聯絡中心應用Amazon Connect中,它能夠根據實時對話檢測客戶問題,并能夠自動回復、給出建議以及提供相關資料,該功能現已正式可用。
其次,亞馬遜云科技提供了Amazon CodeWhisperer代碼生成工具,通過近乎實時的生成代碼建議,幫助企業更快、更便捷地去構建應用程序。通過Amazon CodeWhisperer可以通過簡單的自然語言的交互,就可以生成代碼,目前該應用已經支持15種最流行的編程語言。
今年,Amazon CodeWhisperer也有重要更新,提供了建議編碼和定制化預覽功能。Amazon CodeWhisperer的最大特點是,可以近乎實時地生成代碼,幫助開發者更快、更安全地構建應用程序。開發者可以通過自然語言構建應用,然后在IDE中收到準確的代碼建議。
讓編寫代碼任務變得更快,讓更多開發者受益。Amazon CodeWhisperer秉承普惠AI理念,可以免費供開發者使用。幾個月之前,Amazon CodeWhisperer還發布了定制化預覽功能,企業用戶可以安全地基于內部代碼庫來學習,快速獲得更相關、定制化和更有用的代碼建議。
很明顯,亞馬遜云科技一系列生成式AI創新的背后,都在致力于把產品做得更好,持續為客戶帶來價值,這也是亞馬遜云科技過去做云計算的方式。基于客戶需求,進行產品的快速迭代,這種“Day one”的技術理念,在每一款產品的創新中都體現得淋漓盡致!
從2023年12月12日起,re:Invent中國行將走進北京、上海、深圳、廣州、成都、青島、南京、西安、杭州、長沙,各大城市的用戶及開發者都可以體驗到最新產品和技術,通過生成式AI構建應用,為產業數字化轉型賦能。2023年12月15日,re:Invent中國行在廣州和成都同期開啟,感興趣的朋友可以點擊原文鏈接,一鍵速看亞馬遜云科技 re:Invent 2023 的所有熱門發布 ,了解更多內容。