
Google(GOOGL) 最新宣布針對旗下人工智慧模型 Gemini API 推出全新的定價分級制度。這次更新主要針對不同企業的推理使用需求,提供從即時客服到大型離線數據處理的多樣化選擇,幫助開發者在運算速度、使用成本與系統可靠性之間取得最佳平衡,進一步擴大 AI 商業化版圖。
彈性與批次模式享半價折扣,助企業降低成本
針對非緊急的運算需求,Google(GOOGL) 推出了「彈性」與「批次」兩種高性價比模式。彈性模式善用系統離峰的運算資源,提供標準定價的五折優惠,目標處理時間約落在一到十五分鐘之間。而批次 API 同樣提供五折折扣,適合處理延遲容忍度最高達二十四小時的龐大數據任務,為企業有效節省 AI 營運開銷。
優先模式確保毫秒級反應,鎖定即時關鍵應用
針對需要極速反應的關鍵業務,Google(GOOGL) 特別設計了「優先」模式。雖然費用較標準定價高出 75% 到 100%,但能將延遲時間大幅壓縮至毫秒或秒級別。官方強烈建議將此高階模式應用於即時客戶服務機器人、金融防詐欺偵測系統,以及對企業營運至關重要的 AI 助理工具,確保提供最流暢的使用者體驗。
快取模式採精準計費,提升巨量資料分析效率
隨著企業處理大量文件的需求攀升,Google(GOOGL) 也同步優化了「快取」模式。該模式的收費標準取決於快取憑證的數量與儲存時間長短,非常適合內建複雜系統指令的聊天機器人。此外,若是開發團隊需要對冗長的影片檔案進行重複分析,或是頻繁查詢巨型資料庫,快取模式都能顯著提升整體作業效能並優化成本結構。
發表
我的網誌