臺北市政府在 2017-07-25 於 Join 平台發佈一個競賽公告 : 尋找聰明的聊天機器人
競賽目的是希望大家妥善使用台北市政府公布的「市政網站整合平台之常見問答」開放資料集 來協助市府建立市政的問答機器人。
- 交付作品:參賽者所使用的資料須出自於台北市政府市政網站整合平台常見問答市政 Open Data,或其他本府網站已公開資料,裡面提供臺北市政府各局處 FAQ 資料,建置市政 FAQ ChatBot,並可上線供民眾實際與 ChatBot 進行問答,回答民眾所提出之市政問題。參賽者須自行提供服務架設主機及網路相關設備並開放試用。
原始的問答是放在台北市政府的網站上 : 常見問答。這邊一共有從 2007 到現在所累積的 8512 筆常見問答。內容則是由各部同機關所負責維護。
用意不錯(10 萬塊就可找人幫忙做資料和做三個聊天機器人?疑),但是要做這樣的服務前,似乎該先把資料(常見問答)準備好吧!還是說臺北市資訊局認為這應該是使用資料的人自己就該處理的問題?那整理好的資料,是否也該開放出來呢?但是做為一個開發者,怎麼會不知道這些整理完的資料,與資料(問答)之間的邏輯關係才是我真正的資產。我怎麼可能為了這五萬就賣給你?因為,一個好的問答設計,是能有他的商業價值的。
但是,透過這個競賽也讓人很想知道,如果我們要回過來整理政府機關的 FAQ,在不能大幅改變 FAQ 現有的內容下,應該如何整理這些資料,讓這些資料的實用性能大為提升。
整理台北市政府目前的 FAQ - 建立更實用的資料集。並以此作為 prototype 來提出政府常見問答的改善計畫
讓我們玩看看,一個常見問答該如何有效的轉為資料集
目前臺北市的常見問答有 8512 條,內容分別由不同機關所負責。除了內容上五花八門各種真與假的問答都有,還有清單式的 QA,也就是一個 QA 其實是多個 QA 的整合。
- FAQ 分類不清楚,缺乏有系統的架構
- FAQ 內容可進一步做分類,許多 QA 並不能算是真正的 QA,就只是資訊說明
- 現有關鍵字無法忠實反應 QA 內容
- 不少 QA 除了該重新拆解(一個拆為多個),也有部分 QA 需要重新整合(多個合併為一)
整理來說,政府網站的 QA 就跟政府網站內容一樣,都缺乏一個完整,依照民眾需求所設計的資訊架構。而要讓政府網站扮演真正的資訊傳遞管道的功能,就必須要針對目前網站上的新聞稿與常見問答重新設計與結構化。
- FAQ 拆解
- 依機關,依內容重新整合
- 依內容重新定義關鍵字清單
- 初步資訊架構的建立 - 依照問題領域歸類
- 樹狀架構的設計與規劃
- 由樹狀決策系統建立 FAQ Bots (?)
.