国产美女主播视频一区_国产精品蜜臀在线观看_亚洲成人动漫一区_亚洲视屏在线播放

首頁(yè) > 公益

全球快資訊丨ResponsibleTA提升LLM可靠性,任務(wù)完成更安全、更高效

來(lái)源:機(jī)器之心 時(shí)間:2023-06-24 05:43:53


(資料圖片僅供參考)

機(jī)器之心專欄

機(jī)器之心編輯部

AI 智能助手照進(jìn)現(xiàn)實(shí)。

近幾個(gè)月,ChatGPT、GPT-4 等大語(yǔ)言模型(LLM)展現(xiàn)出突破性的理解、推理、 生成、泛化和對(duì)齊能力,對(duì)各行各業(yè)的研究方式和生產(chǎn)效率均帶來(lái)廣泛而深遠(yuǎn)的變革及影響。 此外,LLM 還展現(xiàn)出在真實(shí)世界的開放場(chǎng)景中解決復(fù)雜問(wèn)題的能力,使 科幻電影中無(wú)所不能的 A I 智能助手照進(jìn)了現(xiàn)實(shí) 。
在實(shí)現(xiàn)自然場(chǎng)景中的任務(wù)自動(dòng)化時(shí),一個(gè)復(fù)雜的任務(wù)往往由多個(gè)子任務(wù)構(gòu)成,這需要多個(gè)模型或 APIs 的協(xié)作。如何確保 LLM 和執(zhí)行器之間高效、安全、穩(wěn)定地協(xié)同工作,是構(gòu)建 Responsible AI ,以及讓 LLM 可靠地為人類提供服務(wù)的關(guān)鍵問(wèn)題。
為了解決這個(gè)問(wèn)題,來(lái)自微軟亞洲研究院的研究團(tuán)隊(duì)提出 Responsible Task Automation (ResponsibleTA) 框架,提升 LLM 和執(zhí)行器之間協(xié)同工作的安全性和有效性。
論文鏈接:/pdf/
項(xiàng)目主頁(yè):/responsible_task_automation/
方法
本文通過(guò)提出一個(gè)新的任務(wù)自動(dòng)化框架,通過(guò)可行性檢測(cè),完成度檢驗(yàn),用戶隱私保護(hù)等三個(gè)模塊,提高了大語(yǔ)言模型作為任務(wù)助手的可靠性,為未來(lái)的人機(jī)交互提供了一種可行的方式。
該系統(tǒng)框架包含基于 LLM 的中央處理單元、指令執(zhí)行器、指令可行性預(yù)測(cè)器、指令完成度檢驗(yàn)器和安全性保護(hù)器。
Responsible Task Automation (ResponsibleTA) 框架示意圖
當(dāng) ResponsibleTA 接收到復(fù)雜任務(wù)對(duì)應(yīng)的高層級(jí)指令時(shí),安全性檢測(cè)自動(dòng)將包含用戶隱私的命令實(shí)體替換成對(duì)應(yīng)的占位符,然后將去隱私化的指令發(fā)送給部署在云端的 LLM,LLM 據(jù)此規(guī)劃實(shí)現(xiàn)該負(fù)責(zé)任務(wù)目標(biāo)的單步指令,然后發(fā)送給的部署在本地的執(zhí)行器實(shí)際執(zhí)行相關(guān)操作。從 Responsible AI 的角度出發(fā),該框架賦予 LLM 三個(gè)新的能力:
1)可行性預(yù)測(cè):ResponsibleTA 框架針對(duì) LLM 和執(zhí)行器的協(xié)同,開發(fā)設(shè)計(jì)了可行性預(yù)測(cè)模塊。該模塊用于對(duì) LLM 的輸出進(jìn)行可行性判斷,及時(shí)攔截不可行的執(zhí)行指令,從而規(guī)避在執(zhí)行這些指令的過(guò)程中產(chǎn)生的不可控風(fēng)險(xiǎn)。當(dāng) LLM 輸出的指令判斷為「不可行」時(shí),可行性預(yù)測(cè)期會(huì)將其分析結(jié)果返回給 LLM,并要求其重新進(jìn)行任務(wù)規(guī)劃,力求將合理可行性的指令交付給執(zhí)行器,提升任務(wù)自動(dòng)化的成功率。
2)完成度檢驗(yàn):ResponsibleTA 框架設(shè)計(jì)了一個(gè)完成度檢驗(yàn)器,用于在執(zhí)行器每次執(zhí)行結(jié)束后自動(dòng)檢查其執(zhí)行結(jié)果是否符合預(yù)期。該模塊根據(jù)執(zhí)行器執(zhí)行后的即時(shí)狀態(tài),判斷 LLM 當(dāng)前規(guī)劃是否完成,并提供及時(shí)補(bǔ)救的可能。當(dāng)執(zhí)行狀態(tài)判定為「未完成」時(shí),完成度檢驗(yàn)器會(huì)要求 LLM 啟動(dòng) replanning,使其能夠及時(shí)調(diào)整任務(wù)規(guī)劃。
完成度檢 驗(yàn)器和上述可行性預(yù)測(cè)器,分別在 LLM 輸出指令的執(zhí)行前后,對(duì)指 令的合理性和執(zhí)行的完成性進(jìn)行校驗(yàn),為任務(wù)自動(dòng)化的可靠性提供了雙重保險(xiǎn)。
3)用戶隱私保護(hù):ResponsibleTA 框架還設(shè)置了用戶隱私保護(hù)機(jī)制,該機(jī)制通過(guò)一個(gè)本地記憶單元實(shí)現(xiàn)。當(dāng)用戶將高層級(jí)命令發(fā)送給部署在云端的大語(yǔ)言模型時(shí),ResponsibleTA 中的隱私保護(hù)模塊自動(dòng)將命令中的隱私信息(如:用戶名、密碼、地址等)替換成對(duì)應(yīng)的占位符,而當(dāng)大語(yǔ)言模型將規(guī)劃的低層級(jí)指令發(fā)送給部署在本地的執(zhí)行器是,占位符會(huì)被自動(dòng)替換成對(duì)應(yīng)的真實(shí)信息。于此方式,用戶的隱私信息僅在本地被存儲(chǔ)和被使用,無(wú)需發(fā)送至云端,從而避免在傳輸和使用中的不可控風(fēng)險(xiǎn)。
針對(duì) ResponsibleTA 中的可行性預(yù)測(cè)和完成度檢查功能,其研究團(tuán)隊(duì)在 UI 任務(wù)自動(dòng)化場(chǎng)景下提出并對(duì)比了兩種不同的技術(shù)路線,并在實(shí)驗(yàn)部分詳細(xì)分析了這兩種技術(shù)路線的特點(diǎn)。以可行性預(yù)測(cè)為例,第一種技術(shù)方案通過(guò) Prompting 的方式利用大語(yǔ)言模型內(nèi)部知識(shí)進(jìn)行判斷。具體地,研究者訓(xùn)練了一個(gè)屏幕解析模型將 UI 頁(yè)面解析成所含 UI 元素的語(yǔ)言描述,并將和指令一起輸入給 GPT-4 模型,讓 GPT-4 判斷當(dāng)前指令的可行性。具體方案如下圖所示。
基于 prompt engineering 的(指令)可行性預(yù)測(cè)器實(shí)現(xiàn)方案
另一種技術(shù)方案在于訓(xùn)練一個(gè)專用的多模態(tài)模型,該模型接收 UI 頁(yè)面的視覺(jué)信號(hào)和對(duì)應(yīng)的語(yǔ)言指令為輸入,輸出該指令的可行性判定結(jié)果,具體結(jié)構(gòu)如下圖。
基于專用模型的(指令)可行性預(yù)測(cè)器實(shí)現(xiàn)方案
完成度檢驗(yàn)器的實(shí)現(xiàn)方案于可行性預(yù)測(cè)器類似,在此不詳細(xì)贅述。
實(shí)驗(yàn)
該工作的作者首先對(duì) ResponsibleTA 中的關(guān)鍵模塊進(jìn)行定性實(shí)驗(yàn),驗(yàn)證其有效性,并對(duì)比不同實(shí)現(xiàn)方式的特點(diǎn)。據(jù)下表所示實(shí)驗(yàn)結(jié)果,作者認(rèn)為專用模型能夠提供更優(yōu)的實(shí)驗(yàn)結(jié)果但需要收集特定任務(wù)對(duì)應(yīng)的數(shù)據(jù)和標(biāo)注用于模型訓(xùn)練,而基于 LLM 的技術(shù)方案也能達(dá)到不錯(cuò)的效果,并在實(shí)際部署的成本和靈活性方面具有優(yōu)勢(shì)。
可行性預(yù)測(cè)器和完成度檢驗(yàn)器的定性實(shí)驗(yàn)結(jié)果
作者還在真實(shí)世界的實(shí)際使用場(chǎng)景中進(jìn)行 online testing, 并匯報(bào)了基線模型,具有可行性預(yù)測(cè)器的 ResponsibleTA 框架和完整版的 ResponsibleTA 框架在 12 個(gè)實(shí)際 UI 任務(wù)執(zhí)行過(guò)程中的具體表現(xiàn)。作者觀察到所提出的可行性預(yù)測(cè)器和完成度檢驗(yàn)器能夠避免執(zhí)行不可理 / 不可行的指令,并能通過(guò)讓 LLM 進(jìn)行 replanning 的方式進(jìn)行及時(shí)補(bǔ)救,從而提升任務(wù)自動(dòng)化的成功率。
真實(shí)世界中實(shí)例研究定量結(jié)果。表格中的數(shù)字表示 「有效執(zhí)行步數(shù) / 總共執(zhí)行步數(shù) (人類專家執(zhí)行步數(shù))」。
此外,作者還通過(guò)具體的案例分析直觀地展現(xiàn)了 ResponsibleTA 框架中的關(guān)鍵模型如何對(duì)一個(gè)失敗案例進(jìn)行補(bǔ)救,使其成為一個(gè)成功案例。
案例分析:進(jìn)入亞馬遜網(wǎng)站并將最便宜的充電器添加至購(gòu)物車。

?THE END

轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)

投稿或?qū)で髨?bào)道:content@

相關(guān)稿件

全球快資訊丨ResponsibleTA提升LLM可靠性,任務(wù)完成更安全、更高效

我市真金白銀鼓勵(lì)企業(yè)增資擴(kuò)產(chǎn)

11.82公里!全國(guó)最長(zhǎng)城市高鐵隧道盾構(gòu)始發(fā)段基坑開挖

港股早盤電力設(shè)備大幅下挫,金風(fēng)科技(02208.HK)跌9.60%,上海電氣(02727.HK)跌3.72%。 每日看點(diǎn)

播報(bào):貴州都勻有啥好玩的_貴州省都勻市有什么好玩的地方

全球熱推薦:中國(guó)唯一沒(méi)有平原的省份,遍地是風(fēng)景,這地方還有親切感

遼寧莊河警方通報(bào)“男子殺害哥哥一家六口”:嫌犯已被抓獲|資訊

環(huán)球速看:英鎊/日元匯率今日預(yù)期趨勢(shì):看漲(2023/6/23)

每日快播:美官員:美國(guó)海軍系統(tǒng)或曾檢測(cè)到失蹤潛水器內(nèi)爆聲音

每日焦點(diǎn)!菱角排骨湯,家常的湯水要燉得湯鮮味美還是得有一點(diǎn)小技巧的

環(huán)球短訊!108坊故事|“人人講安全 個(gè)個(gè)會(huì)應(yīng)急” 東儀社區(qū)開展消防安全演練

16支隊(duì)伍角逐揚(yáng)州“七河八島”龍舟賽,隊(duì)員:真正體會(huì)到了什么叫“同舟共濟(jì)”

50歲女人夏季怎么穿更優(yōu)雅?學(xué)會(huì)闊腿褲搭配,氣場(chǎng)“秒殺”普通人

【環(huán)球聚看點(diǎn)】下個(gè)月頗受幸運(yùn)之神眷顧的幾大星座,好事接二連三出現(xiàn)

每日熱訊!點(diǎn)燃“夜經(jīng)濟(jì)” 首屆合肥啤酒龍蝦嘉年華熱鬧“開席”

如果星座不是說(shuō)明書,那它是什么?-世界最資訊

美官員:美國(guó)海軍系統(tǒng)或曾檢測(cè)到失蹤潛水器內(nèi)爆聲音

焦耳是什么的計(jì)量單位(焦耳的單位是什么?)-每日時(shí)訊

世界消息!“科大硅谷”以色列推介會(huì)在特拉維夫召開

白面煎餅面糊怎么調(diào)? 煎餅的面糊怎么做?

人社部發(fā)布致2023屆高校畢業(yè)生的一封信 世界熱議

暑期大劇預(yù)熱!《折腰》比《與鳳行》熱度更高,95花或?qū)⒊?5花

男子突發(fā)心臟驟停 重慶醫(yī)生4分鐘生死急救-播資訊 全球速遞

浙江發(fā)布山洪災(zāi)害預(yù)警 這些地方請(qǐng)注意!

當(dāng)前簡(jiǎn)訊:被全國(guó)通報(bào)表?yè)P(yáng)的“空中鐵拳”,是誰(shuí)?

焦點(diǎn)精選!沈陽(yáng)居然之家渾南店LG新品發(fā)布,前沿黑科技邂逅生活美學(xué)

桐梓?興茂康養(yǎng)旅游度假區(qū)——端午FUN肆“嗨”|這份端午出行攻略記得收藏|環(huán)球今熱點(diǎn)

“泰坦”號(hào)深海潛水器發(fā)生內(nèi)爆-關(guān)注

【全球新視野】寧夏出臺(tái)應(yīng)急預(yù)案力奪全年糧食豐收

2023年度山東省國(guó)際科技合作基地?cái)M認(rèn)定名單公示


主站蜘蛛池模板: 免费在线国产精品| 91国产一区在线| 日韩精品av一区二区三区| 久久免费视频在线| 午夜精品久久久内射近拍高清| 国产一区二区视频免费在线观看| 人人妻人人澡人人爽欧美一区| 国产成人欧美在线观看| 久久精品ww人人做人人爽| 日韩aⅴ视频一区二区三区| 色综合久久中文字幕综合网小说| 国产在线观看91精品一区| 欧美综合国产精品久久丁香| 午夜精品久久久久久久男人的天堂 | 91免费国产网站| 国产精品精品视频| 精品国产中文字幕| 国产欧洲精品视频| 国产精品国模在线| 岛国一区二区三区高清视频| 国产区欧美区日韩区| 国产精品午夜国产小视频| 国产美女精彩久久| 国产成人在线一区| 亚洲v日韩v欧美v综合| 人妻精品无码一区二区三区 | 欧美激情国产精品日韩| 欧美日韩午夜爽爽| 久久久久国产一区二区三区| 久久99久久精品国产| 国产欧美日韩中文字幕在线| 国产精品久久久久久久久久久久午夜片 | 国产精品自产拍在线观看| 日韩欧美一级在线| 在线免费一区| 日韩在线视频中文字幕| 亚洲一区二区三区乱码aⅴ| 日本午夜在线亚洲.国产| 久久的精品视频| 国产精品美女久久久久久免费| 91久热免费在线视频|