技術媒合網

科研產業化平台


    快速搜尋        

半結構化文件的資訊擷取方法 ONLINE EXTRACTION RULE ANALYSIS FOR SEMI-STRUCTURED DOCUMENTS
專利名稱 半結構化文件的資訊擷取方法 ONLINE EXTRACTION RULE ANALYSIS FOR SEMI-STRUCTURED DOCUMENTS
申請日 (校編號) 2004/04/19  (092035TW)
專利證書號 I237780 中華民國
專利權人 國立中央大學
發明人 張嘉惠、郭釋謙


技術摘要:
本發明提供一種線上資訊擷取方法,稱為線上擷取規則分析(Online Extraction Rule Analysis, OLERA),適用於半結構化文件的資訊擷取(Information Extraction),以使用者框 選感興趣的目標區域、系統解析文件且作階層化編碼以進一步擷取、最後透過屬性的指定完成 所需要擷取資訊的綱目(schema),讓使用者不必經過繁複的標示便可將資料完整的擷取,並解 決單一記錄以及多筆記錄的網頁擷取問題。



聯繫方式
聯絡人:研發處智權技轉組 與我連絡
電話:03-4227151 #27076、27077 網址:http://www.caic.ncu.edu.tw/
地 址: 32001桃園市中壢區中大路300號
 
                 
瀏覽人數:38189