<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Yeom,&#x20;KW</dcvalue>
<dcvalue element="contributor" qualifier="author">Park,&#x20;JH</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-01-21T04:04:06Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-01-21T04:04:06Z</dcvalue>
<dcvalue element="date" qualifier="created">2021-09-04</dcvalue>
<dcvalue element="date" qualifier="issued">2005-12</dcvalue>
<dcvalue element="identifier" qualifier="issn">0302-9743</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;135940</dcvalue>
<dcvalue element="description" qualifier="abstract">We&#x20;examine&#x20;an&#x20;automated&#x20;mechanism,&#x20;which&#x20;allows&#x20;users&#x20;to&#x20;access&#x20;this&#x20;information&#x20;in&#x20;a&#x20;structured&#x20;manner&#x20;by&#x20;segmenting&#x20;unformatted&#x20;text&#x20;records&#x20;into&#x20;structured&#x20;elements,&#x20;annotating&#x20;these&#x20;documents&#x20;using&#x20;XML&#x20;tags&#x20;and&#x20;using&#x20;specific&#x20;query&#x20;processing&#x20;techniques.&#x20;This&#x20;research&#x20;is&#x20;the&#x20;first&#x20;step&#x20;to&#x20;make&#x20;an&#x20;automatic&#x20;ontology&#x20;generation&#x20;system.&#x20;Therefore,&#x20;we&#x20;focus&#x20;on&#x20;the&#x20;explanation&#x20;how&#x20;we&#x20;can&#x20;automatically&#x20;extract&#x20;structure&#x20;when&#x20;seeded&#x20;with&#x20;a&#x20;small&#x20;number&#x20;of&#x20;training&#x20;examples.&#x20;We&#x20;propose&#x20;an&#x20;approach&#x20;based&#x20;on&#x20;Hidden&#x20;Markov&#x20;Models&#x20;to&#x20;build&#x20;a&#x20;powerful&#x20;probabilistic&#x20;model&#x20;that&#x20;corroborates&#x20;multiple&#x20;sources&#x20;of&#x20;information&#x20;including,&#x20;the&#x20;sequence&#x20;of&#x20;elements,&#x20;their&#x20;length&#x20;distribution,&#x20;distinguishing&#x20;words&#x20;from&#x20;the&#x20;vocabulary&#x20;and&#x20;an&#x20;optional&#x20;external&#x20;data&#x20;dictionary.&#x20;We&#x20;introduce&#x20;two&#x20;different&#x20;HMM&#x20;models&#x20;for&#x20;information&#x20;extraction&#x20;from&#x20;different&#x20;sources&#x20;such&#x20;as&#x20;bibliography&#x20;and&#x20;Call&#x20;for&#x20;Papers&#x20;documents&#x20;as&#x20;a&#x20;training&#x20;dataset.&#x20;The&#x20;proposed&#x20;HMM&#x20;learn&#x20;to&#x20;distinguish&#x20;the&#x20;fields,&#x20;and&#x20;then&#x20;extract&#x20;title,&#x20;authors,&#x20;conference&#x2F;journal&#x20;names,&#x20;etc.&#x20;from&#x20;the&#x20;text.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">SPRINGER-VERLAG&#x20;BERLIN</dcvalue>
<dcvalue element="title" qualifier="none">An&#x20;approach&#x20;of&#x20;information&#x20;extraction&#x20;from&#x20;web&#x20;documents&#x20;for&#x20;automatic&#x20;ontology&#x20;generation</dcvalue>
<dcvalue element="type" qualifier="none">Article</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">COMPUTATIONAL&#x20;INTELLIGENCE&#x20;AND&#x20;SECURITY,&#x20;PT&#x20;1,&#x20;PROCEEDINGS,&#x20;v.3801,&#x20;pp.450&#x20;-&#x20;457</dcvalue>
<dcvalue element="citation" qualifier="title">COMPUTATIONAL&#x20;INTELLIGENCE&#x20;AND&#x20;SECURITY,&#x20;PT&#x20;1,&#x20;PROCEEDINGS</dcvalue>
<dcvalue element="citation" qualifier="volume">3801</dcvalue>
<dcvalue element="citation" qualifier="startPage">450</dcvalue>
<dcvalue element="citation" qualifier="endPage">457</dcvalue>
<dcvalue element="description" qualifier="journalRegisteredClass">scie</dcvalue>
<dcvalue element="description" qualifier="journalRegisteredClass">scopus</dcvalue>
<dcvalue element="identifier" qualifier="wosid">000234873700066</dcvalue>
<dcvalue element="identifier" qualifier="scopusid">2-s2.0-33646837519</dcvalue>
<dcvalue element="relation" qualifier="journalWebOfScienceCategory">Computer&#x20;Science,&#x20;Artificial&#x20;Intelligence</dcvalue>
<dcvalue element="relation" qualifier="journalWebOfScienceCategory">Computer&#x20;Science,&#x20;Information&#x20;Systems</dcvalue>
<dcvalue element="relation" qualifier="journalWebOfScienceCategory">Computer&#x20;Science,&#x20;Theory&#x20;&amp;&#x20;Methods</dcvalue>
<dcvalue element="relation" qualifier="journalResearchArea">Computer&#x20;Science</dcvalue>
<dcvalue element="type" qualifier="docType">Article;&#x20;Proceedings&#x20;Paper</dcvalue>
<dcvalue element="subject" qualifier="keywordAuthor">Ontology&#x20;Generation</dcvalue>
<dcvalue element="subject" qualifier="keywordAuthor">Web&#x20;Document</dcvalue>
<dcvalue element="subject" qualifier="keywordAuthor">Information</dcvalue>
<dcvalue element="subject" qualifier="keywordAuthor">Extraction&#x20;Approach</dcvalue>
</dublin_core>
