close
人工智能初創企業

本地初創利用 NLP 開發法律案件分析平台 工傷搜尋引擎助工友爭取合理賠償

自然語言處理技術(NLP)近年經常被應用到自動化客戶服務系統以及語音助理之上,而原來在法律界亦可以應用這技術,降低獲得相關資源的門檻。有本地初創就利用 NLP 技術開發法律案件分析平台,協助工友搜尋工傷索償案件的記錄以便爭取合理賠償。

有一班香港大學學生創辦的 LiteX,是一個法律案例分析平台,可以從大量的案例之中,透過 NLP 技術,找出符合需要的內容並且進行分析,大幅提升相關研究的效率。他們的首個產品為 EC Bank,主要針對工傷索償案件,透過相對業界其他工具更簡單易用的介面,加上自動 NLP 分析和篩選,期望能讓有需要的工會和工友可以在爭取合理賠償、尋求法律意見時有更好的支援。

首個產品針對工傷案件

LiteX 行政總裁 Chloe Chan 分享指,他們首個產品 EC Bank 工傷搜索引擎的主要目標用戶其實都是一群協助工友的工會,例如是街工等。在現行的法例之下,如果有些僱員因工作關係受傷或死亡的話,僱主是要負上責任。但這些僱員很多時並沒有法律知識的基礎,很多時不知道應否上訴一些判傷的百分比,還是接受一個金額比較低的和解項目。很多工會的案件處理人員未必知道究竟這個判決書的解讀,不知道怎樣才算是合理的賠償額。

她表示,EC Bank 特別之處就是可以讓用家在搜尋時選擇篩選的條件,可以選擇受傷的位置、年齡、職位等,基於自己的案件條件尋找最符合的案件,有一個參考,究竟一個合理的索償指標是怎樣。

透過揀選受傷工友的職業、受傷部位、收入及想搜尋的案件年份,可令系統自動篩選出相乎的參考個案。

自動深入分析有助提升篩選準確度

雖然現時法律界也有其他搜尋引擎可以做到類似的功能,但 Chloe 指,現有的搜尋引擎只會提供一個關鍵字搜索 (Keyword Search) 而非關鍵因素搜索 (KeyFactor Search)。例如有一個廚師的頸椎受傷,如果輸入「廚師、頸椎、人身傷亡、賠償」這幾個關鍵字的話,可能只會顯示出有那些案件有這些關鍵字,但不代表這些案件對應我們處理中的案情,很多時候到最後還是律師自己人手逐一查看案件。為了解決這個問題,EC Bank 配合了數據標籤和 NLP 系統,希望把整個提取關鍵因素的系統自動化,希望可以初步篩選與律師處理中的案件相乎的資料。

個案的相關判詞,賠償百分比、病假數目、處理日子、當事人年齡及當時月入。(圖片從網站中截取)

非結構資料整理成可讀取數據需時

EC Bank 的資料庫仍然在發展當中,Chloe 表示,因為判決書是非結構資料 (Unstructured data),即未經整理的資料,例如存於網頁的文字、影像,或記錄器蒐集到的網絡行為,他們我們一開始就需要進行網頁抓取 (Web scraping),針對獲取特定網域底下的數個分頁的資料,轉化成結構化的格式以便分析。這方面他們也需要跟律政司磋商,研究有哪些令人感疑惑的字眼需要注意。

在完成網頁抓取後,這些判決書就會讓他們進行數據標記,之後假設資料的一個段落有需要的關鍵因素,就會把這些數據輸入到 NLP 系統。目前 EC Bank 已經完成二百至三百個職業傷病訴訟案例及人身傷亡個案,他們的 CTO Enoch 已經做過測試,發現原來大概三百至四百個案例就能讓準確度達到大約七成。接下來這一個月的目標是能夠標籤四百個案例,然後再測試自然語言處理系統,看看它的表現。

除了參考案例,搜尋器整合了已有數據,製作了一個賠償金額計算機讓用家參考。

未來將擴充應用範疇

目前這個產品正由不同機構試用,亦讓工會能夠加入案件資料好讓資料庫能夠更完善。同時,他們計劃擴展更多種類的案件,製作一個更全面的數據庫及搜尋引擎,以繼續支持第一個產品持續開發。

Chloe 指,他們的收費模式會以月費繳付計算,作為一個法律科技,可能中小型的律師樓會願意嘗試這個服務,因為他們未必好像一些大型律師樓般有專人處理關於僱員的案件,這些中小型律師樓可能只有兩三個或者一人處理全部案件,若以這個軟件協助整理案例的話,工作效率方面相信會大幅提高。她並表示,針對律師使用的版本會提供更多的資料,例如裁判官的判詞和相關案例,以減省律師的前期工作時間。

▲ LiteX 行政總裁 Chloe Chan(右)表示團體積極載入更多數據,期望能提供一個更具參考指標的數據庫。

Tags :legal techlocal startupNLP
Antony Shum

The authorAntony Shum