<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Choi,&#x20;Jaewoong</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Byungju</dcvalue>
<dcvalue element="date" qualifier="accessioned">2025-11-17T08:03:59Z</dcvalue>
<dcvalue element="date" qualifier="available">2025-11-17T08:03:59Z</dcvalue>
<dcvalue element="date" qualifier="created">2025-11-14</dcvalue>
<dcvalue element="date" qualifier="issued">2024-02</dcvalue>
<dcvalue element="identifier" qualifier="issn">2662-4443</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;153515</dcvalue>
<dcvalue element="description" qualifier="abstract">Materials&#x20;language&#x20;processing&#x20;(MLP)&#x20;can&#x20;facilitate&#x20;materials&#x20;science&#x20;research&#x20;by&#x20;automating&#x20;the&#x20;extraction&#x20;of&#x20;structured&#x20;data&#x20;from&#x20;research&#x20;papers.&#x20;Despite&#x20;the&#x20;existence&#x20;of&#x20;deep&#x20;learning&#x20;models&#x20;for&#x20;MLP&#x20;tasks,&#x20;there&#x20;are&#x20;ongoing&#x20;practical&#x20;issues&#x20;associated&#x20;with&#x20;complex&#x20;model&#x20;architectures,&#x20;extensive&#x20;fine-tuning,&#x20;and&#x20;substantial&#x20;human-labelled&#x20;datasets.&#x20;Here,&#x20;we&#x20;introduce&#x20;the&#x20;use&#x20;of&#x20;large&#x20;language&#x20;models,&#x20;such&#x20;as&#x20;generative&#x20;pretrained&#x20;transformer&#x20;(GPT),&#x20;to&#x20;replace&#x20;the&#x20;complex&#x20;architectures&#x20;of&#x20;prior&#x20;MLP&#x20;models&#x20;with&#x20;strategic&#x20;designs&#x20;of&#x20;prompt&#x20;engineering.&#x20;We&#x20;find&#x20;that&#x20;in-context&#x20;learning&#x20;of&#x20;GPT&#x20;models&#x20;with&#x20;few&#x20;or&#x20;zero-shots&#x20;can&#x20;provide&#x20;high&#x20;performance&#x20;text&#x20;classification,&#x20;named&#x20;entity&#x20;recognition&#x20;and&#x20;extractive&#x20;question&#x20;answering&#x20;with&#x20;limited&#x20;datasets,&#x20;demonstrated&#x20;for&#x20;various&#x20;classes&#x20;of&#x20;materials.&#x20;These&#x20;generative&#x20;models&#x20;can&#x20;also&#x20;help&#x20;identify&#x20;incorrect&#x20;annotated&#x20;data.&#x20;Our&#x20;GPT-based&#x20;approach&#x20;can&#x20;assist&#x20;material&#x20;scientists&#x20;in&#x20;solving&#x20;knowledge-intensive&#x20;MLP&#x20;tasks,&#x20;even&#x20;if&#x20;they&#x20;lack&#x20;relevant&#x20;expertise,&#x20;by&#x20;offering&#x20;MLP&#x20;guidelines&#x20;applicable&#x20;to&#x20;any&#x20;materials&#x20;science&#x20;domain.&#x20;In&#x20;addition,&#x20;the&#x20;outcomes&#x20;of&#x20;GPT&#x20;models&#x20;are&#x20;expected&#x20;to&#x20;reduce&#x20;the&#x20;workload&#x20;of&#x20;researchers,&#x20;such&#x20;as&#x20;manual&#x20;labelling,&#x20;by&#x20;producing&#x20;an&#x20;initial&#x20;labelling&#x20;set&#x20;and&#x20;verifying&#x20;human-annotations.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">SPRINGERNATURE</dcvalue>
<dcvalue element="title" qualifier="none">Accelerating&#x20;materials&#x20;language&#x20;processing&#x20;with&#x20;large&#x20;language&#x20;models</dcvalue>
<dcvalue element="type" qualifier="none">Article</dcvalue>
<dcvalue element="identifier" qualifier="doi">10.1038&#x2F;s43246-024-00449-9</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">Communications&#x20;Materials,&#x20;v.5,&#x20;no.1</dcvalue>
<dcvalue element="citation" qualifier="title">Communications&#x20;Materials</dcvalue>
<dcvalue element="citation" qualifier="volume">5</dcvalue>
<dcvalue element="citation" qualifier="number">1</dcvalue>
<dcvalue element="description" qualifier="isOpenAccess">Y</dcvalue>
<dcvalue element="description" qualifier="journalRegisteredClass">scopus</dcvalue>
<dcvalue element="identifier" qualifier="scopusid">2-s2.0-85185560476</dcvalue>
</dublin_core>
