欧美日韩国产女主播|久久青春操无码日韩va国产va|国语自产自偷拍|少妇视频一区在线精品 亚洲中文字幕无码vs色欲_在线观看视频免费国产成人_精品无码久久中文字幕_日韩AV中文字幕网址

人工智能自動化 | 20+ GenAI UX 模式、示例和實施策略

20+ GenAI UX 模式、示例和實施策略

生成式人工智能通過關(guān)注基于意圖的結(jié)果規(guī)范,為人類與系統(tǒng)交互提供了一種新的方式。GenAI 帶來了新的挑戰(zhàn),因為它的輸出是概率性的,需要理解變異性、記憶、錯誤、幻覺和惡意使用,這就帶來了構(gòu)建原則和設(shè)計模式的必要性,正如 IBM 所描述的那樣。

此外,任何AI 產(chǎn)品都是一個分層系統(tǒng),其中 LLM 只是其中一種成分,而內(nèi)存、編排、工具擴展、UX 和代理用戶流才是真正的魔力!

本文是我對 GenAI 設(shè)計模式演變的研究和記錄,這些模式為產(chǎn)品經(jīng)理、數(shù)據(jù)科學家和交互設(shè)計師提供了一種通用語言 ,幫助他們打造以人為本、值得信賴且安全的產(chǎn)品。通過應(yīng)用這些模式,我們可以彌合用戶需求、技術(shù)能力和產(chǎn)品開發(fā)流程之間的差距。

以下是 21 種 GenAI UX 模式

  1. GenAI 或無 GenAI
  2. 將用戶需求轉(zhuǎn)化為數(shù)據(jù)需求
  3. 增強或自動化
  4. 定義自動化水平
  5. 逐步采用人工智能
  6. 利用心智模型
  7. 傳達產(chǎn)品限制
  8. 顯示思路鏈(CoT)
  9. 利用多種輸出
  10. 提供數(shù)據(jù)源
  11. 傳達模型信心
  12. 為記憶和回憶而設(shè)計
  13. 提供上下文輸入?yún)?shù)
  14. 為 coPilot、共同編輯或部分自動化而設(shè)計
  15. 定義自動化的用戶控件
  16. 用戶輸入錯誤狀態(tài)的設(shè)計
  17. 針對人工智能系統(tǒng)錯誤狀態(tài)的設(shè)計
  18. 設(shè)計以捕捉用戶反饋
  19. 模型評估設(shè)計
  20. 人工智能安全護欄設(shè)計
  21. 傳達數(shù)據(jù)隱私和控制

1. GenAI 還是非 GenAI

評估 GenAI 是否改善了用戶體驗或增加了復(fù)雜性。通常,基于啟發(fā)式 (IF/Else) 的解決方案更易于構(gòu)建和維護。

GenAI 有益的場景

  • 開放式、富有創(chuàng)意且能增強用戶體驗的任務(wù)。
    例如,寫作提示、總結(jié)筆記、起草回復(fù)。
  • 創(chuàng)建或轉(zhuǎn)換復(fù)雜的輸出(例如,圖像、視頻、代碼)。
    例如,將草圖轉(zhuǎn)換為網(wǎng)站代碼。
  • 結(jié)構(gòu)化的用戶體驗無法捕捉用戶意圖。

應(yīng)避免使用 GenAI 的情況

  • 結(jié)果必須精確、可審計或確定。
    例如,稅務(wù)表格或法律合同。
  • 用戶期望清晰一致的信息。
    例如:開源軟件文檔

如何使用此模式

  1. 確定客戶旅程中的摩擦點
  2. 評估技術(shù)可行性:確定人工智能是否能夠解決摩擦點。評估規(guī)模、數(shù)據(jù)集可用性、錯誤風險評估和經(jīng)濟投資回報率。
  3. 驗證用戶期望:
    -
    通過評估系統(tǒng)是否增強了人類的努力還是完全取代了人類的努力,確定人工智能解決方案是否侵蝕了用戶期望,如模式 3“增強與自動化”中所述。-
    確定人工智能解決方案是否侵蝕了模式 6“心智模型”

2. 將用戶需求轉(zhuǎn)化為數(shù)據(jù)需求

這種模式確保 GenAI 開發(fā)始于用戶意圖以及實現(xiàn)該意圖所需的數(shù)據(jù)模型。GenAI
系統(tǒng)的優(yōu)劣取決于其訓練數(shù)據(jù)。但真正的用戶并非以行列的方式表達,他們表達的是目標、挫折和行為。如果團隊未能將用戶需求轉(zhuǎn)化為結(jié)構(gòu)化的、模型可用的輸入,最終的系統(tǒng)或產(chǎn)品可能會優(yōu)化到錯誤的結(jié)果,從而導(dǎo)致用戶流失。

如何使用此模式

  1. 作為 PM、產(chǎn)品設(shè)計師和數(shù)據(jù)科學家的跨職能團隊進行協(xié)作,并針對值得解決的用戶問題進行協(xié)調(diào)。
  2. 定義用戶需求通過使用三角研究:定性(市場報告、調(diào)查或問卷)+ 定量(用戶訪談、觀察性研究)+ 突發(fā)(產(chǎn)品評論、社交聆聽等)和綜合用戶洞察 JTBD框架同理心地圖將用戶的情緒和觀點形象化。價值主張畫布將用戶的收益和痛苦與功能結(jié)合起來
  3. 通過 選擇合適的數(shù)據(jù)模型來定義數(shù)據(jù)需求和文檔,進行差距分析,并根據(jù)需要迭代優(yōu)化數(shù)據(jù)模型。一旦理解了“為什么”,就將其轉(zhuǎn)化為模型的“什么” 。你的AI模型需要哪些特征、標簽、示例和上下文來學習這種行為?利用結(jié)構(gòu)化協(xié)作來找出答案。

3. 增強 vs. 自動化

GenAI 應(yīng)用中的一個關(guān)鍵決策是完全自動化任務(wù)還是增強人類能力。使用此模式可以使技術(shù)與用戶意圖和控制偏好保持一致。

自動化最適合用戶傾向于委派的任務(wù),尤其是在繁瑣、耗時或不安全的情況下。例如,Intercom FinAI 會自動將冗長的電子郵件線索匯總為內(nèi)部筆記,從而節(jié)省重復(fù)性、低價值任務(wù)的時間。

增強功能能夠提升效率、創(chuàng)造力和控制力,從而增強用戶想要持續(xù)參與的任務(wù)。例如, Abelton 的Magenta Studio支持創(chuàng)造性的控制,方便用戶操控和創(chuàng)作新音樂。

如何使用此模式

  1. 為了選擇最佳方法,請使用研究綜合工具(如同理心地圖(可視化用戶情緒和觀點)和價值主張畫布(了解用戶的收益和痛苦))評估用戶需求和期望
  2. 測試并驗證該方法是否會削弱或增強用戶體驗。

4. 定義自動化水平

在人工智能系統(tǒng)中,自動化指的是將多少控制權(quán)委托給人工智能而不是用戶。這是一種戰(zhàn)略性的用戶體驗?zāi)J?,它根?jù)用戶的痛點、情境場景和對產(chǎn)品的期望來決定自動化程度。

自動化水平

  1. 無自動化(AI 輔助,用戶自主決定)
    AI 系統(tǒng)為用戶提供幫助和建議,但所有決定均由用戶自行決定。例如,Grammarly會突出顯示語法問題,但用戶需要自行決定接受或拒絕更正。
  2. 部分自動化/副駕駛/共同編輯(AI 在用戶監(jiān)督下行動)
    AI 發(fā)起操作或生成內(nèi)容,但用戶根據(jù)需要進行審核或干預(yù)。例如,GitHub Copilot會建議開發(fā)人員可以接受、修改或忽略的代碼。
  3. 完全自動化(AI 獨立行動)
    AI 系統(tǒng)無需用戶干預(yù)即可執(zhí)行任務(wù),通?;陬A(yù)定義的規(guī)則、工具和觸發(fā)器。GenAI 中的完全自動化通常被稱為代理系統(tǒng) (Agentic systems)例如,Ema可以自主規(guī)劃和執(zhí)行多步驟任務(wù),例如研究競爭對手、生成報告并通過電子郵件發(fā)送,無需用戶在每個步驟提示或干預(yù)。

如何使用此模式

  1. 評估用戶需要自動化的痛點及其風險:當相關(guān)風險較低且發(fā)生故障不會造成嚴重后果時,自動化任務(wù)最為有效。低風險任務(wù)(例如發(fā)送自動提醒、促銷郵件、過濾垃圾郵件或處理常規(guī)客戶咨詢)可以自動化,最大程度地減少負面影響,同時節(jié)省時間和資源。高風險任務(wù)(例如進行醫(yī)療診斷、發(fā)送關(guān)鍵業(yè)務(wù)郵件或執(zhí)行金融交易)需要仔細監(jiān)督,因為一旦發(fā)生錯誤,可能會造成重大損失。
  2. 評估和設(shè)計特定的自動化級別:根據(jù)用戶的期望和目標,評估用戶痛點是否應(yīng)該屬于——無自動化、部分自動化或完全自動化。
  3. 定義用戶控件以實現(xiàn)自動化(參考模式 15)

5. GenAI 的逐步采用

當用戶第一次接觸基于新技術(shù)的產(chǎn)品時,他們常常想知道系統(tǒng)能做什么和不能做什么,它如何工作以及他們應(yīng)該如何與它交互。

該模式提供了多維策略來幫助用戶使用 AI 產(chǎn)品或功能、減少錯誤、與用戶準備情況保持一致,以提供明智且以人為本的用戶體驗。

如何使用此模式

這種模式是許多其他模式的頂峰

  1. 從一開始就注重傳達好處:避免深入探討技術(shù)細節(jié),并強調(diào)人工智能如何帶來新的價值。
  2. 簡化用戶引導(dǎo)體驗:在詢問用戶數(shù)據(jù)共享偏好之前,先讓用戶體驗系統(tǒng)的價值,并優(yōu)先提供基礎(chǔ) AI 功能的即時訪問權(quán)限。鼓勵用戶稍后注冊以解鎖高級 AI 功能或分享更多詳細信息。例如,Adobe FireFly循序漸進地引導(dǎo)用戶從基礎(chǔ)功能到高級 AI 功能。
  3. 定義自動化水平(參考模式 4) 逐步增加自主性或復(fù)雜性。
  4. 通過針對錯誤進行設(shè)計 來提供可解釋性和信任(參考模式 16 和 17)。
  5. 傳達數(shù)據(jù)隱私和控制(參考模式 21),以清楚地傳達如何收集、存儲、處理和保護用戶數(shù)據(jù)。

6. 利用心智模型

心智模型幫助用戶預(yù)測系統(tǒng)(網(wǎng)頁、應(yīng)用程序或其他類型的產(chǎn)品)的運作方式,從而影響他們與界面的交互方式。當產(chǎn)品與用戶現(xiàn)有的心智模型相符時,用戶會感覺直觀且易于上手。當兩者發(fā)生沖突時,可能會導(dǎo)致用戶沮喪、困惑,甚至放棄。

例如,Github Copilot 建立在開發(fā)人員從傳統(tǒng)代碼自動完成的思維模型之上,從而簡化了向 AI 驅(qū)動的代碼建議的過渡

例如,Adobe Photoshop 建立在使用矩形控件擴展圖像的熟悉方法的基礎(chǔ)上,通過集成其生成填充功能,智能地填充新創(chuàng)建的空間。

如何使用此模式

通過提問來識別并建立現(xiàn)有的心智模型

  1. 用戶旅程是什么以及用戶試圖做什么?
  2. 哪些心智模型可能已經(jīng)存在?
  3. 該產(chǎn)品是否打破了任何直觀的因果模式?
  4. 你是否打破了現(xiàn)有的心智模型?如果是,請清晰地解釋如何以及原因。良好的引導(dǎo)、微文案和視覺提示可以幫助彌合差距。

7. 傳達產(chǎn)品限制

這種模式涉及清楚地傳達人工智能模型能做什么和不能做什么,包括其知識邊界、能力和局限性。

它有助于建立用戶信任、設(shè)定適當?shù)钠谕?、防止誤用,并在模型出現(xiàn)故障或異常行為時減少挫敗感。

如何使用此模式

  1. 明確說明模型的局限性:顯示過時知識或缺乏實時數(shù)據(jù)的上下文提示。例如,當問題超出其知識范圍時, Claude會說明其知識范圍。
  2. 當模型無法提供合適的輸出時,提供回退或升級選項。例如,當被問及與購物無關(guān)的問題時, Amazon Rufus會說:“它無法訪問事實信息,我只能協(xié)助解決與購物相關(guān)的問題和請求。”
  3. 在產(chǎn)品營銷、入職培訓、工具提示或回應(yīng)免責聲明中明確限制

8. 顯示思路鏈(CoT)

在人工智能系統(tǒng)中,思路鏈(CoT) 提示 技術(shù) 通過模仿人類更結(jié)構(gòu)化、循序漸進的思維過程,增強了模型解決復(fù)雜問題的能力。

CoT 展示是一種用戶體驗?zāi)J?,它通過揭示 AI 是如何得出結(jié)論的來提高透明度。這可以增強用戶信任,提高可解釋性,并為用戶反饋提供空間,尤其是在高風險或模糊場景下。

例如,Perplexity通過顯示處理步驟來增強透明度,幫助用戶理解答案背后的深思熟慮的過程。

例如,Khanmigo是一種人工智能輔導(dǎo)系統(tǒng),它通過模仿人類推理來逐步指導(dǎo)學生解決問題,以增強理解和學習。

如何使用此模式

  1. 顯示“研究”和“推理”等狀態(tài) 來傳達進展,減少用戶的不確定性,讓等待時間感覺更短。
  2. 使用漸進式披露:從高級摘要開始,并允許用戶根據(jù)需要擴展細節(jié)。
  3. 提供 AI 工具透明度:清晰顯示 AI 用于生成建議的外部工具和數(shù)據(jù)源。
  4. 展現(xiàn)信心和不確定性:表明人工智能信心水平,并在相關(guān)時強調(diào)不確定性。

9. 利用多種輸出

GenAI 憑借其概率特性,能夠?qū)ν惠斎氘a(chǎn)生不同的響應(yīng)。這種模式通過并排呈現(xiàn)多個輸出來利用可變性。展示多樣化的選項有助于用戶創(chuàng)造性地探索、比較、改進或做出更符合其意圖的決策。例如, Google Gemini提供了多種選項,幫助用戶探索、改進并做出更明智的決策。

如何使用此模式

  1. 解釋變化的目的:幫助用戶理解輸出之間的差異是故意的,旨在提供選擇。
  2. 啟用編輯功能:讓用戶無縫地對輸出進行評分、選擇、重新混合或編輯,從而塑造結(jié)果并提供反饋。例如, Midjourney 可以幫助用戶調(diào)整提示,并指導(dǎo)用戶使用重新混合功能進行修改和編輯。

10.提供數(shù)據(jù)源

在 GenAI 應(yīng)用程序中,清晰地闡明數(shù)據(jù)源對于透明度、可信度和用戶信任至關(guān)重要。清晰地表明 AI 的知識來源有助于用戶評估響應(yīng)的可靠性并避免錯誤信息。

這在醫(yī)療保健、金融或法律指導(dǎo)等高風險事實領(lǐng)域尤其重要,因為決策必須基于經(jīng)過驗證的數(shù)據(jù)。

如何使用此模式

  1. 內(nèi)聯(lián)引用可靠來源:將來源顯示為腳注、工具提示或可折疊鏈接。例如,NoteBookLM會在其答案中添加引用,并將每個答案直接鏈接到用戶上傳的文檔部分。
  2. 清晰披露訓練數(shù)據(jù)范圍:對于生成工具(文本、圖像、代碼),請簡單解釋模型訓練時使用了哪些數(shù)據(jù),以及未包含哪些數(shù)據(jù)。例如,Adobe Firefly披露其生成填充功能是在庫存圖像、公開授權(quán)作品以及版權(quán)已過期的公共領(lǐng)域內(nèi)容上進行訓練的。
  3. 提供來源級信心:在有多個來源貢獻的情況下,直觀地區(qū)分更高信心或更權(quán)威的來源。

11. 傳達模型信心

AI 生成的輸出具有概率性,準確度可能存在差異。顯示置信度分數(shù)可以傳達模型對其輸出的確定性。這有助于用戶評估可靠性并做出更明智的決策。

如何使用此模式

  1. 評估情境和決策風險:顯示模型置信度取決于情境及其對用戶決策的影響。在醫(yī)療保健、金融或法律咨詢等高風險場景中,顯示置信度分數(shù)至關(guān)重要。然而,在AI 生成的藝術(shù)作品或故事敘述等低風險場景中,顯示置信度可能不會帶來太多價值,甚至可能帶來不必要的困惑。
  2. 選擇合適的可視化:如果設(shè)計研究表明展示模型置信度有助于決策,那么下一步就是選擇合適的可視化方法。百分比、進度條或一些修飾語(“可能”、“不確定”)都能有效地傳達置信度。合適的可視化方法取決于應(yīng)用程序的用例和用戶的熟悉程度。例如,Grammarly會使用“可能”之類的修飾語來描述它與用戶共同生成的內(nèi)容。
  3. 在低信心情況下指導(dǎo)用戶行動:提供前進的路徑,例如提出澄清問題或提供替代選項。

12. 為記憶和回憶而設(shè)計

記憶和回憶是一個重要的概念和設(shè)計模式,它使人工智能產(chǎn)品能夠存儲和重用過去交互中的信息,例如用戶偏好、反饋、目標或任務(wù)歷史,以提高連續(xù)性和情境感知。

  • 通過記住過去的選擇或偏好來增強個性化
  • 通過避免重復(fù)輸入請求來減輕用戶負擔,尤其是在多步驟或長格式任務(wù)中
  • 支持復(fù)雜任務(wù),如項目規(guī)劃中的縱向工作流程、通過參考或借鑒過去的進展進行學習歷程。

用于訪問信息的記憶可能是短暫的會話內(nèi)的短期)持久的跨會話的長期),并且可能包括對話上下文、行為信號或明確的輸入。

如何使用此模式

  1. 定義用戶上下文并選擇記憶類型。
    根據(jù)用例選擇記憶類型,例如短暫記憶、持久記憶或兩者兼有。購物助理可能實時跟蹤交互,無需為未來會話保留數(shù)據(jù),而個人助理則需要長期記憶來實現(xiàn)個性化。
  2. 在用戶交互中智能地使用記憶
    為 LLM 構(gòu)建基本提示,以便根據(jù)上下文回憶和傳達信息(例如,“上次你喜歡更輕松的語氣。我應(yīng)該繼續(xù)嗎?”)。
  3. 傳達透明度并提供控制功能
    清晰地傳達正在保存的內(nèi)容,并允許用戶查看、編輯或刪除已存儲的記憶。使“刪除記憶”操作易于訪問。例如,ChatGPT 在其平臺上提供了廣泛的控制功能,可隨時查看、更新或刪除記憶

13.提供上下文輸入?yún)?shù)

情境輸入?yún)?shù)通過簡化用戶交互來提升用戶體驗,并更快地實現(xiàn)用戶目標。通過利用用戶特定數(shù)據(jù)、用戶偏好、過往交互,甚至來自其他具有相似偏好的用戶的數(shù)據(jù),GenAI 系統(tǒng)可以定制輸入和功能,以更好地滿足用戶意圖和決策。

如何使用此模式

  1. 利用先前的交互:根據(jù)用戶先前輸入的內(nèi)容預(yù)填充輸入。參考 模式 12,記憶與回憶。
  2. 使用自動完成或智能默認設(shè)置:在用戶輸入時,根據(jù)個人和全局使用模式提供智能的實時建議。例如,Perplexity會根據(jù)您當前的查詢線索,提供智能的后續(xù)查詢建議。
  3. 推薦交互式 UI 小部件:根據(jù)系統(tǒng)預(yù)測,提供定制的輸入小部件,例如提示框、滑塊和復(fù)選框,以增強用戶輸入體驗。例如,ElevenLabs允許用戶通過顯示預(yù)設(shè)或默認值來微調(diào)語音生成設(shè)置。

14. 為副駕駛/共同編輯/部分自動化而設(shè)計

副駕駛是一種增強模式,AI 充當協(xié)作助手,在用戶掌控全局的同時,提供情境化和數(shù)據(jù)驅(qū)動的洞察。這種設(shè)計模式在戰(zhàn)略制定、構(gòu)思、寫作、設(shè)計或編碼等領(lǐng)域至關(guān)重要,因為這些領(lǐng)域的結(jié)果具有主觀性,用戶擁有獨特的偏好,或者用戶的創(chuàng)意輸入至關(guān)重要。

副駕駛 加快工作流程,增強創(chuàng)造力并減少認知負荷,但人類仍保留創(chuàng)作權(quán)和最終決策權(quán)。

如何使用此模式

  1. 嵌入內(nèi)聯(lián)幫助:AI 建議會根據(jù)上下文進行呈現(xiàn),方便用戶輕松接受、拒絕或修改。例如,Notion AI 可以幫助您起草、總結(jié)和編輯內(nèi)容,同時您可以掌控最終版本。
  2. 保存用戶意圖和創(chuàng)意方向:讓用戶通過目標、語氣或示例等輸入來引導(dǎo) AI,同時保持原創(chuàng)性和創(chuàng)意方向。例如,Jasper AI 允許用戶設(shè)置品牌語調(diào)和語氣指南,幫助構(gòu)建 AI 輸出,使其更好地匹配用戶意圖。

15. 設(shè)計自動化的用戶控件

構(gòu)建 UI 級機制,讓用戶根據(jù)用戶目標、上下文場景或系統(tǒng)故障狀態(tài)管理或覆蓋自動化。

沒有系統(tǒng)能夠預(yù)測所有用戶情境。控制賦予用戶自主權(quán),即使人工智能出錯,也能保持信任。

如何使用此模式

  1. 采用漸進式展現(xiàn):從最低限度的自動化功能開始,逐漸允許用戶選擇更復(fù)雜或自主的功能。
    例如,Canva Magic Studio一開始會提供簡單的 AI 建議,例如文本或圖像生成 ,然后逐步展示高級工具,例如 Magic Write、AI 視頻場景和品牌語音定制。
  2. 為用戶提供自動化控制功能: 提供諸如 開關(guān)、滑塊或基于規(guī)則的設(shè)置等UI 控件,讓用戶選擇何時以及如何控制自動化功能。例如,Gmail 允許用戶禁用智能撰寫功能。
  3. 自動化錯誤恢復(fù)設(shè)計:當 AI 出現(xiàn)故障(誤報/漏報)時,向用戶提供糾正措施。添加手動覆蓋、撤消或升級到人工支持的選項。例如,GitHub Copilot 建議內(nèi)聯(lián)代碼,但當輸出關(guān)閉時,開發(fā)人員可以輕松拒絕、修改或撤消建議。

16. 設(shè)計用戶輸入錯誤狀態(tài)

GenAI 系統(tǒng)通常依賴于對人類輸入的解讀。當用戶提供模糊、不完整或錯誤的信息時,AI 可能會誤解其意圖或產(chǎn)生低質(zhì)量的輸出。

輸入錯誤通常反映的是用戶期望與系統(tǒng)理解之間的不匹配。妥善處理這些問題對于維護信任和確保順暢的交互至關(guān)重要。

如何使用此模式

  1. 優(yōu)雅地處理拼寫錯誤:當置信度較高(例如,> 80% )時,使用拼寫檢查或模糊匹配自動糾正常見的輸入錯誤,并巧妙地進行表面更正(“顯示結(jié)果......”)。
  2. 提出澄清性問題:當輸入過于模糊或有多種解釋時,提示用戶提供缺失的上下文。在對話設(shè)計中,當意圖明確但實體不明確時,就會發(fā)生此類錯誤。了解更多關(guān)于實體和意圖的信息。例如,當 ChatGPT 給出“首都是什么?”這樣的低語境提示時,它會提出后續(xù)問題,而不是猜測。
  3. 支持快速更正:方便用戶編輯或覆蓋您的解釋。例如,ChatGPT 在已提交的提示旁邊顯示一個編輯按鈕,方便用戶修改輸入。

17. 人工智能系統(tǒng)錯誤狀態(tài)的設(shè)計

GenAI 輸出本質(zhì)上是概率性的,容易出現(xiàn)幻覺、偏見和上下文錯位等錯誤。

與傳統(tǒng)系統(tǒng)不同,GenAI 的錯誤狀態(tài)難以預(yù)測。針對這些狀態(tài)進行設(shè)計需要透明度、恢復(fù)機制和用戶自主性。精心設(shè)計的錯誤狀態(tài)可以幫助用戶了解 AI 系統(tǒng)的邊界并重新獲得控制權(quán)。

混淆矩陣有助于分析人工智能系統(tǒng)錯誤,并通過顯示以下計數(shù)來深入了解模型的執(zhí)行情況
-真陽性(正確識別陽性案例)
-假陽性(錯誤識別陽性案例)
-真陰性(正確識別陰性案例)
-假陰性(未能識別陰性案例)

人工智能錯誤和故障狀態(tài)的場景

  1. 系統(tǒng)故障(錯誤輸出)
    由于數(shù)據(jù)質(zhì)量差、存在偏見或模型錯覺,會出現(xiàn)假陽性或假陰性。例如,花旗銀行金融欺詐系統(tǒng)會顯示一條消息:“異常交易。您的卡已被凍結(jié)。如果是您本人操作的,請驗證您的身份。”
  2. 系統(tǒng)限制錯誤(無輸出)
    由于未經(jīng)訓練的用例或知識缺口,會出現(xiàn)真負例。例如,當 ODQA 系統(tǒng)接收到訓練數(shù)據(jù)集之外的用戶輸入時,會拋出以下錯誤:“抱歉,我們沒有足夠的信息。請嘗試其他查詢!”
  3. 上下文錯誤(誤解輸出)由于解釋不清或與用戶預(yù)期相沖突而導(dǎo)致用戶困惑的
    真陽性結(jié)果屬于上下文錯誤。例如,當用戶從新設(shè)備登錄時,被鎖定。AI 會回復(fù):“您的登錄嘗試已被標記為可疑活動。”

如何使用此模式

  1. 傳達各種場景的人工智能錯誤:使用諸如
    “這可能不準確”、“這看起來像......”或表面置信度水平之類的短語來幫助校準信任。
  2. 使用模式傳達低置信度輸出的模型置信度。
  3. 提供錯誤恢復(fù):如果發(fā)生系統(tǒng)故障或上下文錯誤,請?zhí)峁┣逦穆窂絹砀采w、重試或升級問題。
    例如,使用“嘗試其他查詢”、“讓我改進一下”或“聯(lián)系客服”等方式。
  4. 啟用用戶反饋:輕松報告幻覺或錯誤輸出。了解更多關(guān)于模式 19 的信息。設(shè)計以捕獲用戶反饋。

18. 設(shè)計時要捕捉用戶反饋

現(xiàn)實世界的一致性需要直接的用戶反饋來改進模型,從而改進產(chǎn)品。當人們與人工智能系統(tǒng)互動時,他們的行為會塑造并影響他們未來收到的輸出。從而形成一個持續(xù)的反饋循環(huán),系統(tǒng)和用戶的行為都會隨著時間的推移而不斷調(diào)整。例如,ChatGPT使用“反應(yīng)”按鈕和“評論”框來收集用戶反饋。

如何使用此模式

  1. 考慮隱性反饋:捕捉用戶操作,例如跳過、忽略、編輯或互動頻率。這些被動信號提供了有價值的行為線索,有助于調(diào)整推薦內(nèi)容或發(fā)現(xiàn)用戶不感興趣的行為模式。
  2. 尋求明確的反饋:通過點贊/踩、NPS 評分小部件或用戶操作后的快速調(diào)查問卷,收集用戶的直接反饋。利用這些反饋來改進模型行為和產(chǎn)品契合度。
  3. 告知反饋的用途:讓用戶了解他們的反饋將如何影響未來的體驗。這可以增強信任,并鼓勵用戶持續(xù)做出貢獻。

19. 模型評估設(shè)計

強大的 GenAI 模型需要在訓練期間以及部署后持續(xù)進行評估。評估旨在確保模型按預(yù)期運行,識別錯誤和幻覺,并與用戶目標保持一致,尤其是在高風險領(lǐng)域。

如何使用此模式

三種關(guān)鍵的評估方法可以改進機器學習系統(tǒng)。

  1. 基于法學碩士 (LLM) 的評估(LLM-as-a-judge)一個獨立的語言模型充當自動評判者。它可以對回復(fù)進行評分,解釋其推理過程,并分配諸如有用/有害或正確/不正確等標簽。
    例如,Amazon Bedrock 使用 LLM-as-a-Judge 方法來評估 AI 模型的輸出。一個獨立的可信 LLM(例如 Claude 3 或 Amazon Titan)會根據(jù)有用性、準確性、相關(guān)性和安全性自動審核和評分回復(fù)。例如,比較兩個 AI 生成的針對同一提示的回復(fù),評判模型會選擇更優(yōu)的那個。這種自動化方法可將評估成本降低高達 98%,并加快模型選擇速度,而無需依賴緩慢且昂貴的人工審核。
  2. 啟用基于代碼的評估:對于結(jié)構(gòu)化任務(wù),使用測試套件或已知輸出來驗證模型性能,特別是對于數(shù)據(jù)處理、生成或檢索。
  3. 捕捉人工評估:集成實時 UI 機制,方便用戶將輸出標記為有用、有害、不正確或不清楚。更多詳情,請參閱模式 19。捕捉用戶反饋的設(shè)計
  4. LLM 作為評判者和人工評估的混合方法將準確率大幅提高到 99%。

20. AI護欄設(shè)計

人工智能護欄的設(shè)計意味著在GenAI模型中建立實踐和原則,以最大限度地減少傷害、錯誤信息、不良行為和偏見。至關(guān)重要的是

  • 保護用戶和兒童免受有害語言、虛構(gòu)事實、偏見或虛假信息的侵害。
  • 建立信任和采用:當用戶知道系統(tǒng)避免仇恨言論和錯誤信息時,他們會感到更安全并愿意經(jīng)常使用它。
  • 道德合規(guī):歐盟人工智能法案等新規(guī)要求人工智能設(shè)計必須安全。團隊必須符合這些標準,才能保持合法合規(guī)并承擔社會責任。

如何使用此模式

  1. 分析并引導(dǎo)用戶輸入:如果提示可能導(dǎo)致不安全或敏感內(nèi)容,則引導(dǎo)用戶進行更安全的交互。例如,Miko 機器人遇到臟話時,它會回答“我不允許使用此類語言”。
  2. 過濾輸出并審核內(nèi)容:使用實時審核功能檢測并過濾可能有害的 AI 輸出,在顯示給用戶之前屏蔽或重新構(gòu)建它們。例如,顯示一條注釋:“此回復(fù)已根據(jù)我們的安全準則進行了修改。”
  3. 使用主動警告:當用戶接觸敏感或高風險信息時,巧妙地通知他們。例如“這只是信息建議,不能替代醫(yī)療指導(dǎo)。”
  4. 創(chuàng)建強大的用戶反饋機制:讓用戶輕松舉報不安全、帶有偏見或虛假信息的輸出,從而通過主動學習循環(huán)逐步改進人工智能。例如,Instagram 提供了應(yīng)用內(nèi)選項,方便用戶舉報傷害、偏見或虛假信息。
  5. 交叉驗證關(guān)鍵信息:對于高風險領(lǐng)域(例如醫(yī)療保健、法律、金融),使用可信數(shù)據(jù)庫備份 AI 生成的輸出,以捕捉幻覺。參考模式 10, 提供數(shù)據(jù)源。

21. 傳達數(shù)據(jù)隱私和控制

這種模式確保 GenAI 應(yīng)用程序清楚地傳達如何收集、存儲、處理和保護用戶數(shù)據(jù)。

GenAI 系統(tǒng)通常依賴于敏感數(shù)據(jù)、情境數(shù)據(jù)或行為數(shù)據(jù)。處理不當可能會導(dǎo)致用戶不信任、法律風險或意外濫用。清晰地傳達隱私保護措施有助于用戶感到安全、受到尊重并掌控全局。例如,Slack AI 明確表示,客戶數(shù)據(jù)仍歸客戶所有并控制,不會用于訓練 Slack 或任何第三方 AI 模型。

如何使用此模式

  1. 顯示透明度:當 GenAI 功能訪問用戶數(shù)據(jù)時,顯示訪問內(nèi)容和原因的解釋。
  2. 設(shè)計選擇加入和選擇退出流程:允許用戶輕松切換數(shù)據(jù)共享偏好設(shè)置。
  3. 啟用數(shù)據(jù)審查和刪除:允許用戶查看、下載或刪除他們的數(shù)據(jù)歷史記錄,從而讓他們能夠持續(xù)控制。

蘭亭妙微(www.bjlzjm.com.cn )是一家專注而深入的界面設(shè)計公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的大數(shù)據(jù)可視化界面設(shè)計、B端界面設(shè)計、桌面端界面設(shè)計、APP界面設(shè)計、圖標定制、用戶體驗設(shè)計交互設(shè)計、UI咨詢高端網(wǎng)站設(shè)計、平面設(shè)計,以及相關(guān)的軟件開發(fā)服務(wù),咨詢電話:01063334945。我們建立了一個微信群,每天分享國內(nèi)外優(yōu)秀的設(shè)計,有興趣請加入一起學習成長,咨詢及進群請加藍小助微信ben_lanlan。

日歷

鏈接

個人資料

藍藍設(shè)計的小編 http://www.bjlzjm.com.cn

存檔