污水處理廠營運評鑑系統之語意分析與自動標籤功能
2023/03/24
為改善案主─內政部營建署因評鑑作業中累積的龐大資料量,在傳統人工作業上的諸多問題,例如在執行時的耗時費力;若以傳統的人工作業方式進行,將耗費專業工作者大量的時間與心力,故期望借助人工智能的方式,如文字探勘工具(text mining),來達到效率快速、客觀、精確,且更利於進行大量資料與複雜處理的大數據分析及管理,來取代以往傳統人工方式進行分析、統整的作業過程。
緣起背景
基於傳統人工作業方式在評鑑作業時所面臨到的諸多問題,如因其龐鉅的大數據資料在分析、控管與維護上之艱鉅,在作業時間上往往需要長久的時間與耗費執行者的心力;且因涉及專業領域,在人員流動時的銜接與協作問題,以及基於執行者在人為主觀上認知的歧異性所產生出的偏差與協作問題,所導致的各種人為疏失、主觀誤差與協作問題,都再再地增加了傳統作業方式在執行、控管與維護評鑑系統時的難度與問題;
但這些問題,卻都能在新科技的賦能,透過人機協作的數位化轉型方式,來完美地克服─即藉由運用人工智慧與大數據資料的分析,來處理龐鉅且繁雜的海量資料;而信諾因長年深耕在數位轉型、新科技賦能領域,並在大數據分析以及機器學習演算法上成功執行過許多案例,故期望透過信諾豐富的成功經驗,為案主的問題痛點,提供客製化的解決方案,並透過數位科技之賦能,朝向智慧管理的方向邁進。
3分鐘掌握專案績效重點
在引進語意分析與自動標籤(Auto Tagging)功能以前,案主所使用的傳統人工的作業方式,不僅耗時費力,還因評鑑作業涉及認知的主觀問題,且在人員流動時的協作上─更加劇了作業困難,與資料及系統之控管與維護上的不易;故希望透過新科技的賦能與大數據資料的分析技術,來建立起便捷、高效的控管系統。
透過各種參數細膩的設定與調校,輔以人工智能(以下簡稱AI)的賦能助益,能免除傳統的人工判斷作業方式的工作量及人為誤差與人員流動跟協作等問題;藉由後端系統的調校與運算,能持續優化在歷年的數據資訊;綜上所述,皆能減免評鑑人員的作業負擔,並更加智慧與便利地完善化評鑑作業的相關問題,如解決了因沒有評鑑作業的語意分析功能之不便性,並透過評鑑意見的雲端化來追蹤進程以掌握全局;藉由AI賦能的輔助,則能為案主提供資訊整合與優化之效益;而傳統人工作業之問題,亦能藥到病除。
除了上述透過雲端化的作業方式,達到資訊之分析與控管的效益外,更透過AI的科技賦能,藉著文字探勘─語意分析的功效,達到不只是「檢索」的效益;因為傳統的檢索功能─只能藉由關鍵字的比對,來查找出使用者所需要的資訊;但卻有著使用上根本的「盲點」問題─即對沒有出現使用者所查找之關鍵字時所產生的「撲空」,或儘管有出現,但卻沒有特別做論述,而只找到徒具有關鍵字「空殼」的,「非」關鍵資訊。
因為語意分析具有「分析」功能的特質,而檢索的功能卻只能做到─將檢索條件如實找出;但有時只出現了檢索條件的關鍵字,卻不一定重要,或是根本沒有出現關鍵字,但卻在語意的脈絡語境中,正在論述著關於關鍵字的重要訊息;而語意分析則能將這些沒有出現到的關鍵字,透過信諾獨家的切詞技術與建立起相對應案主專業領域的專業詞庫及加權計算方式,不僅克服了傳統檢索功能上的盲點問題,更能藉由語意分析及相關技術的搭配與加乘,依照案主需求,做客製化的「處理」,以達更多的功能與成效來助益案主。
重要功能展示
在「評鑑意見線上追蹤與加值分析系統」的功能效益上,除了能查詢檢索,及追蹤進度與回報外;藉由為案主量身訂製的細膩設定選項,並透過專業詞庫的創建與切詞技術、詞頻權重、關聯性分析、特徵提取等技術,能讓案主快速地掌握最急迫需要的關鍵情資,並獲得比傳統檢索功能所無法企及的,「多更多」的收獲─例如在「沒有」關鍵字的情況下,找出具有關鍵字語境脈絡,如指定的處理單元或專業領域之詞庫中之關鍵情資;經過信諾在數位上的賦能,可讓案主以最便捷、速效地,「全面」掌握在評鑑辦理上的各種情況,做好對作業與進度上的控管。
在公共污水處理廠營運評鑑管理系統中的〈評鑑意見語意分析〉裡的選項─如年度、發言人、污水處理廠、發言內容之關鍵字等,皆可自由設定。在〈主題〉與〈專業領域〉的檢索上,也能設定單一或複數的查詢標籤,以及核心關鍵詞標籤,滿足案主細膩且專業的檢索條件需求,透過這樣細膩且專業的檢索條件設定,能輕鬆在數以百萬計之的大數據海量資料,為使用者找出最適切的關鍵情資,而不用再大海撈針地瞎忙,如下圖所示:
經由豐富而細膩的選項設定,能讓案主從評鑑的發言人,或相關於發言內容的週邊相關資訊,到處理單元(設備),以及位於各縣市地區的廠站等相關檢索條件,透過語意分析的相關技術,做「相關查詢」之處理,即能為使用者找出具有相關於檢索條件之語境脈絡的關鍵情資,比傳統的關鍵字與條件設定檢索的成效更強大,獲得多更多,讓您全面掌握您所需要的關鍵情資再也不用翻箱倒櫃地瞎找苦忙,只要透過語意分析技術,便不用再耗時費力地大海撈針。
透過信諾在專業詞庫的創建與切詞技術、詞頻權重、關聯性分析、特徵提取等技術,得以獲取比傳統檢索多更多的關鍵情資─例如透過各種技術的分析,將相關於評鑑委員的相關資訊,全都羅列出來─如計畫的基本資料、會議的基本資訊,例如是從什麼時候開始的會議、誰為主席、會議記錄的內容摘要等關鍵情資,讓您以更高效、便捷的方式掌握辦理進度與獲得更好的執行成效。
評鍵系統除了可藉由語意分析來將歷次的評鑑意見做分析,例如針對所欲檢索之關鍵字來查找以外;更可透過〈相關查詢〉的選項功能,來查閱有那些具有「相關性」的資訊,例如意見的發表者─有那些委員,其意見出現的詳細歷史背景情境、論述內容等細節資訊,來掌握在評鑑意見上辦理的狀況,讓您以更高效輕鬆的方式來追蹤進程狀況的方方面面,如下圖所示:
系統不僅收集了,自104年至今的評鑑意見共6753筆資料,且依據案主的業態領域建立起超過一百餘萬字─針對污水處理廠之專業領域的語料庫;再加上33萬條正體中文常用詞字點,以及14332條土木水利專業詞字典─針對污水處理的相關專業詞進行加權計算後,再透過非監督性機器學習分析,建立專業詞條間的詞性關聯分數矩陣,能讓使用者獲得在傳統檢索功能上所無能提供的關鍵情資,如下圖所示:
圖說:細膩的設定值,便捷的成效,都是建基在後端系統裡經過繁複流程的分析工法,及運算所堆疊累積起來的成果。
之所以能讓使用者全面掌握對評鑑意見的方方面面,不錯失遺漏任何重要的蛛絲馬跡線索,乃是藉由信諾在大數據分析與機器學習人工智能領域中深耕的硬實力,以及在後端系統的繁複工法與嚴謹流程─自動標籤(Auto Tagging)這個技術是一個個單項的技術所累積堆疊起的綜合成效,在作業流程上包含了許多環節與技術的應用與處理,如文本切詞/詞宇宙模型訓練/每篇文章的代表詞計算/指定詞與文章代表詞之相似度計算等各個技術的組合,最後才能達成自動標籤的成效;其工程之繁複性與環節間彼此的環環相扣性的細節處理是成效質量高低的關鍵所在。
圖說:自動標籤的處理流程繁複,且各技術間皆環環相扣,最大的效益價值是能讓案主幾乎不需要再透過人工預處理(pre-processing)的方式來進行文章分類或標記的動作。
所有輸入到前端系統中的資料,都會透過中興社的雲端智慧分析雲平台(後端系統),做相關的專業處理,即資訊的加值與優化,例如透過建立好的專業詞庫,進行切詞分析、評鑑意見的語意分析及關聯推薦處理,或對污水廠之重要設備的標籤處理,再匯出到前端系統裡;實際系統運行的流程結構如下圖所示。
要達到讓AI自動辨識字詞以及語意之間的關聯性,為使用者找出並依據可一目了然的摘要化方式,做資訊的加值,要透過許多繁複的工法;例如建立專業詞之詞性關聯分數矩陣與污水廠重要設備詞群,去計算每一個子領域的專業詞與污水廠重要設備之間的關聯性分數;簡單的說,就是在大類目上創建出與相關專業詞之詞性的關聯性,透過切詞技術、關聯性分析、詞頻權重計算與分配之調校,完成這些詞彙(專業詞庫與相關於此領域之自然語言的詞庫資料)跟污水廠重要設備 (大類目如刮泥機) 及其詞群(除臭、生物處理單元ETC)彼此相互關聯的對應關係;而且還能依據U cloud多維語意分析引擎持續在後端系統裡來調校優化詞庫與系統的分析能力如下圖。
在切詞的作業流程中,於設定上,主要調校的項目有自訂詞/新詞/同義詞,並針對詞性關聯性進行AI分析訓練的調校設定與統計查詢、顯著詞的計算與詞頻加權的設定後,才能完成自動標記,讓分析的個案順利建檔達到管理成效。
成果具體效益價值簡要列點如下:
- 總體來說,這套系統能以更速效、便捷的方式,全面提升在評鑑作業上的執行成效。
- 能大幅降低傳統人工作業時所耗費的時間與心力,並提升執行的效率與精準度。
- 藉由語意分析的諸多技術,能獲得在傳統檢索功能中所無法獲得的─「多更多」的檢索成效。
- 在提升管控力、追蹤掌握度、資訊優化與加值的便捷性等,皆有質的飛躍;例如能讓案主以及位於縣市各區域的處理廠之評鑑意見的上傳收集及分析管理,讓各條評漸意見與改善情況得以被妥善的追蹤,並讓評鑑成果能以更便捷、速效的資訊優化方式,如數字的量化或摘要的方式,來呈現「一目了然」的關鍵情資以掌握全局。
專案執行前後之效益比較/比較專案前後差異
在引進語意分析與自動標籤功能以前,案主所使用的傳統人工的作業方式,不僅耗時費力,還因評鑑系統涉及認知的主觀問題,且在人員流動時的協作上─更加劇了作業困難,與資料及系統之控管與維護上的不易;但在透過新科技的賦能與大數據資料的分析技術以後,不僅建立起便捷、高效的控管系統,從而免除了作業人員的時間與心力的浪費,並更加智慧與便利地完善化評鑑作業的相關問題;而且,憑藉著文字探勘─語意分析的諸多技術,還能獲得在傳統檢索功能中所無法獲得的─多更多的檢索成效;且在處理上的效率,具有絕對的優勢,而經過前後比較的結果顯而易見─信諾所提供的系統與服務更加優質且便捷速效地全面提升了案主在作業上的效益。
結語
總體來說,評鑑意見之改善追蹤與加值系統,能讓營建署的評鑑及縣市各區域的處理廠做到內外部評鑑意見的上傳收集及分析管理,讓各條意見與改善情況得以被妥善的追蹤,並讓複評成果以更便捷速效的資訊優化方式,如數字的量化或摘要的方式呈現以外;經由語意分析的諸多技術,能獲得在傳統檢索功能中所無法獲得的─多更多的檢索成效。
且在作業時間上的效率、精準度、資訊加值的應用與延伸效益上,例如設備維運上的延壽節能、異常狀況的自動警示通報功能等效益,藉由新科技的賦能,顯然是效益更佳的最好選擇,更能為後續的相關作業,提供改善之優化的判斷依據,來輔助、支撐決策,或擴充其他作業功能之用,故有全面性的綜效價值。
憑藉著20年大型專案工程的厚實資歷與專業,信諾透過整合式的服務,讓後續相關作業得以持續優化,如追蹤、優化查核、數據歷史積累的準確性提升等;可以說,運用新科技的賦能,以人機協作模式來進行的稽查作業方式能一舉多得,且具有長遠與累積性的綜合性效益,顯然是最佳的選擇。
而此專案的語意分析技術與系統,是110年的產物,如今,性能更強大的語意分析工具─推敲智能分析引擎 (TEXTCHASE AI ANALYSIS ENGINE )已研發完成;是信諾科技AI實驗室團隊耗時兩年,研發多種語意分析技術之集大成的自信之作;除了能幫助使用者在海量文本集結的知識網上,洞察,並掌握深具價值的研究線索外,更是為您推衍歸納出有價知識,多面向、多情境,全方位的成熟探勘技術系統。
其應用方向與情境更是多元;從「產業趨勢分析」、「商情熱點顯象」、「智財脈絡尋跡」,到「市場輿情追蹤」,能協助企業創建智庫,讓企業寶貴的知識藉由雲端匯流,並透過專業的詞庫,有效整合團隊分工及專業領域的心得共享交流變得更簡易。
推敲智能分析引擎 不僅榮獲了評選極其嚴苛的SIIR (Service Industry Innovation Research)獎助的榮耀肯定,能運用人工智慧對大數據進行分析,從紛雜的資料汪洋中淬鍊出具有應用價值、商機潛力,甚至能預測出時代趨勢,以掌握「關鍵情資」。
信諾期許在人工智慧時代中,能協助有需要的用戶一起邁向數位轉型,透過人工智能與大數據分析工具的運用,來幫助用戶找出各自所需的關鍵情資、驅動產品服務的創新,引領業界的核心競爭力成長。
了解更多
回上一頁