專利名稱 | 半結構化文件的資訊擷取方法 ONLINE EXTRACTION RULE ANALYSIS FOR SEMI-STRUCTURED DOCUMENTS |
申請日 (校編號) | 2004/04/19 (092035TW) |
專利證書號 | I237780 中華民國 |
專利權人 | 國立中央大學 |
發明人 | 張嘉惠、郭釋謙 |
技術摘要: | ||||||||
本發明提供一種線上資訊擷取方法,稱為線上擷取規則分析(Online Extraction Rule Analysis, OLERA),適用於半結構化文件的資訊擷取(Information Extraction),以使用者框 選感興趣的目標區域、系統解析文件且作階層化編碼以進一步擷取、最後透過屬性的指定完成 所需要擷取資訊的綱目(schema),讓使用者不必經過繁複的標示便可將資料完整的擷取,並解 決單一記錄以及多筆記錄的網頁擷取問題。 |
||||||||
聯繫方式 | ||||||||
|
||||||||