<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Daeun</dcvalue>
<dcvalue element="contributor" qualifier="author">Mizuseki,&#x20;Hiroshi</dcvalue>
<dcvalue element="contributor" qualifier="author">Choi,&#x20;Jaewoong</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Byungju</dcvalue>
<dcvalue element="date" qualifier="accessioned">2025-11-17T08:03:36Z</dcvalue>
<dcvalue element="date" qualifier="available">2025-11-17T08:03:36Z</dcvalue>
<dcvalue element="date" qualifier="created">2025-11-14</dcvalue>
<dcvalue element="date" qualifier="issued">2025-05</dcvalue>
<dcvalue element="identifier" qualifier="issn">2662-4443</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;153513</dcvalue>
<dcvalue element="description" qualifier="abstract">Recent&#x20;studies&#x20;have&#x20;increasingly&#x20;applied&#x20;natural&#x20;language&#x20;processing&#x20;to&#x20;automatically&#x20;extract&#x20;experimental&#x20;information&#x20;from&#x20;battery&#x20;materials&#x20;literature.&#x20;Despite&#x20;the&#x20;complexity&#x20;of&#x20;battery&#x20;manufacturing—from&#x20;material&#x20;synthesis&#x20;to&#x20;cell&#x20;assembly—no&#x20;comprehensive&#x20;study&#x20;has&#x20;systematically&#x20;organized&#x20;this&#x20;information.&#x20;Here&#x20;we&#x20;present&#x20;a&#x20;language&#x20;modeling-based&#x20;protocol&#x20;for&#x20;extracting&#x20;complete&#x20;battery&#x20;recipes&#x20;from&#x20;scientific&#x20;papers.&#x20;Using&#x20;machine&#x20;learning-based&#x20;filtering&#x20;and&#x20;topic&#x20;modeling,&#x20;we&#x20;identified&#x20;2174&#x20;relevant&#x20;papers&#x20;and&#x20;extracted&#x20;over&#x20;5800&#x20;paragraphs&#x20;describing&#x20;synthesis&#x20;and&#x20;assembly&#x20;procedures.&#x20;Deep&#x20;learning-based&#x20;named&#x20;entity&#x20;recognition&#x20;models&#x20;were&#x20;trained&#x20;to&#x20;extract&#x20;30&#x20;entities&#x20;with&#x20;F1-scores&#x20;of&#x20;88.18%&#x20;and&#x20;94.61%.&#x20;We&#x20;also&#x20;evaluated&#x20;large&#x20;language&#x20;models,&#x20;including&#x20;GPT-4,&#x20;using&#x20;few-shot&#x20;learning&#x20;and&#x20;fine-tuning.&#x20;These&#x20;results&#x20;enabled&#x20;the&#x20;structured&#x20;construction&#x20;of&#x20;165&#x20;end-to-end&#x20;recipes&#x20;and&#x20;identification&#x20;of&#x20;trends&#x20;such&#x20;as&#x20;precursor–method&#x20;associations.&#x20;The&#x20;resulting&#x20;knowledge&#x20;base&#x20;supports&#x20;flexible&#x20;recipe&#x20;retrieval&#x20;and&#x20;provides&#x20;a&#x20;scalable&#x20;framework&#x20;for&#x20;organizing&#x20;protocols&#x20;across&#x20;large&#x20;volumes&#x20;of&#x20;publications,&#x20;thereby&#x20;accelerating&#x20;literature&#x20;review&#x20;and&#x20;data-driven&#x20;battery&#x20;design.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">SPRINGERNATURE</dcvalue>
<dcvalue element="title" qualifier="none">Building&#x20;an&#x20;end-to-end&#x20;battery&#x20;recipe&#x20;knowledge&#x20;base&#x20;via&#x20;transformer-based&#x20;text&#x20;mining</dcvalue>
<dcvalue element="type" qualifier="none">Article</dcvalue>
<dcvalue element="identifier" qualifier="doi">10.1038&#x2F;s43246-025-00825-z</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">Communications&#x20;Materials,&#x20;v.6,&#x20;no.1</dcvalue>
<dcvalue element="citation" qualifier="title">Communications&#x20;Materials</dcvalue>
<dcvalue element="citation" qualifier="volume">6</dcvalue>
<dcvalue element="citation" qualifier="number">1</dcvalue>
<dcvalue element="description" qualifier="isOpenAccess">Y</dcvalue>
<dcvalue element="description" qualifier="journalRegisteredClass">scopus</dcvalue>
<dcvalue element="identifier" qualifier="scopusid">2-s2.0-105005403395</dcvalue>
</dublin_core>
