AWS的基礎(chǔ)模型(Foundation Model)服務(wù)Bedrock現(xiàn)在提供護(hù)欄(Guardrails)功能預(yù)覽,供企業(yè)根據(jù)自身對應(yīng)用程序需求和負(fù)責(zé)任人工智能政策,制定保護(hù)措施。官方提到,借由Bedrock的護(hù)欄功能,將可促進(jìn)最終用戶與生成式人工智能應(yīng)用程序的安全互動。
護(hù)欄能夠評估最終用戶的輸入和基礎(chǔ)模型的回應(yīng),并根據(jù)特定使用案例政策提供額外保護(hù)層,跨不同的基礎(chǔ)模型,包括Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic和Amazon Titan Text,以及經(jīng)微調(diào)的模型發(fā)揮作用。
企業(yè)只要使用簡短的自然語言描述,就可以定義一組在應(yīng)用程序上下文中避免的主題,護(hù)欄能夠偵測并封鎖受限主題的用戶輸入和基礎(chǔ)模型回應(yīng),像是在銀行助理中,企業(yè)可以通過護(hù)欄限制與投資建議相關(guān)的話題。
Bedrock護(hù)欄功能還提供內(nèi)容過濾器,通過自動評估最終用戶的查詢和基礎(chǔ)模型回應(yīng),封鎖屬于限制類別的內(nèi)容,企業(yè)可以經(jīng)由調(diào)整閾值,規(guī)范需要過濾的仇恨、侮辱、性和暴力等限制類別的內(nèi)容。另外,AWS接下來還會在護(hù)欄中添加個人數(shù)據(jù)刪除功能,借由偵測最終用戶輸入和基礎(chǔ)模型回應(yīng),拒絕包含個人數(shù)據(jù)的輸入,并從基礎(chǔ)模型的回應(yīng)中刪除個人數(shù)據(jù)。