<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Park,&#x20;Hana</dcvalue>
<dcvalue element="contributor" qualifier="author">Son,&#x20;Junghyun</dcvalue>
<dcvalue element="date" qualifier="accessioned">2025-02-28T09:30:05Z</dcvalue>
<dcvalue element="date" qualifier="available">2025-02-28T09:30:05Z</dcvalue>
<dcvalue element="date" qualifier="created">2025-02-25</dcvalue>
<dcvalue element="date" qualifier="issued">2025-02-17</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;151811</dcvalue>
<dcvalue element="description" qualifier="abstract">The&#x20;application&#x20;of&#x20;artificial&#x20;intelligence&#x20;(AI)&#x20;in&#x20;analytical&#x20;chemistry&#x20;has&#x20;advanced&#x20;significantly,&#x20;improving&#x20;data&#x20;processing,&#x20;pattern&#x20;recognition,&#x20;and&#x20;decision-making&#x20;in&#x20;complex&#x20;datasets.&#x20;In&#x20;doping&#x20;analysis,&#x20;the&#x20;continuous&#x20;expansion&#x20;of&#x20;the&#x20;World&#x20;Anti-Doping&#x20;Agency&#x20;(WADA)&#x20;list&#x20;of&#x20;prohibited&#x20;substances&#x20;poses&#x20;increasing&#x20;challenges&#x20;to&#x20;conventional&#x20;screening&#x20;and&#x20;reviewing&#x20;results,&#x20;particularly&#x20;in&#x20;maintaining&#x20;analytical&#x20;efficiency&#x20;and&#x20;accuracy.&#x20;To&#x20;address&#x20;these&#x20;limitations,&#x20;this&#x20;study&#x20;applies&#x20;AI-based&#x20;methodologies&#x20;to&#x20;enhance&#x20;the&#x20;detection&#x20;of&#x20;banned&#x20;substances&#x20;in&#x20;mass&#x20;spectrometry&#x20;(MS)&#x20;data.&#x20;A&#x20;major&#x20;obstacle&#x20;in&#x20;doping&#x20;analysis&#x20;is&#x20;the&#x20;extreme&#x20;class&#x20;imbalance,&#x20;with&#x20;positive&#x20;cases&#x20;comprising&#x20;only&#x20;approximately&#x20;1%&#x20;of&#x20;total&#x20;samples.&#x20;Training&#x20;machine&#x20;learning&#x20;models&#x20;on&#x20;such&#x20;highly&#x20;skewed&#x20;datasets&#x20;often&#x20;results&#x20;in&#x20;poor&#x20;sensitivity&#x20;to&#x20;rarely&#x20;positive&#x20;cases.&#x20;To&#x20;overcome&#x20;this&#x20;issue,&#x20;we&#x20;systematically&#x20;evaluated&#x20;multiple&#x20;machine&#x20;learning&#x20;models&#x20;and&#x20;employed&#x20;robust&#x20;validation&#x20;strategies&#x20;to&#x20;improve&#x20;model&#x20;generalizability.&#x20;Specifically,&#x20;six&#x20;machine&#x20;learning&#x20;algorithms―logistic&#x20;regression,&#x20;K-nearest&#x20;neighbor&#x20;(KNN),&#x20;support&#x20;vector&#x20;machine&#x20;(SVM),&#x20;Gaussian&#x20;Naive&#x20;Bayes,&#x20;random&#x20;forest&#x20;(RF),&#x20;and&#x20;extreme&#x20;gradient&#x20;boosting―were&#x20;trained&#x20;and&#x20;assessed&#x20;using&#x20;both&#x20;K-fold&#x20;cross-validation&#x20;and&#x20;leave-one-out&#x20;cross&#x20;validation&#x20;(LOOCV).&#x20;Comparative&#x20;analysis&#x20;demonstrated&#x20;that&#x20;LOOCV&#x20;outperformed&#x20;K-fold&#x20;cross-validation&#x20;by&#x20;improving&#x20;sensitivity&#x20;to&#x20;positive&#x20;cases&#x20;in&#x20;an&#x20;imbalanced&#x20;dataset.&#x20;Notably,&#x20;the&#x20;RF&#x20;and&#x20;KNN&#x20;models&#x20;trained&#x20;with&#x20;LOOCV&#x20;achieved&#x20;100%&#x20;in&#x20;all&#x20;classification&#x20;metrics,&#x20;highlighting&#x20;the&#x20;effectiveness&#x20;of&#x20;LOOCV&#x20;as&#x20;a&#x20;validation&#x20;strategy&#x20;for&#x20;doping&#x20;datasets&#x20;with&#x20;extreme&#x20;class&#x20;imbalance.&#x20;Furthermore,&#x20;the&#x20;implementation&#x20;of&#x20;this&#x20;AI-based&#x20;framework&#x20;reduced&#x20;manual&#x20;intervention,&#x20;improved&#x20;processing&#x20;efficiency,&#x20;and&#x20;enhanced&#x20;consistency&#x20;and&#x20;reliability&#x20;in&#x20;doping&#x20;detection&#x20;workflows.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">Manfred&#x20;Donike&#x20;Institute</dcvalue>
<dcvalue element="title" qualifier="none">Optimizing&#x20;AI&#x20;Models&#x20;for&#x20;Doping&#x20;Detection&#x20;with&#x20;LOOCV&#x20;to&#x20;Address&#x20;Data&#x20;Imbalance&#x20;in&#x20;Mass&#x20;Spectrometry</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">43rd&#x20;Cologne&#x20;Workshop&#x20;on&#x20;Dope&#x20;Analysis&#x20;2025</dcvalue>
<dcvalue element="citation" qualifier="title">43rd&#x20;Cologne&#x20;Workshop&#x20;on&#x20;Dope&#x20;Analysis&#x20;2025</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">GE</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">German&#x20;Sports&#x20;University&#x20;(Cologne,&#x20;Germany)</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2025-02-16</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">Manfred&#x20;Donike&#x20;Workshop&#x20;(43rd&#x20;Cologne&#x20;Workshop&#x20;on&#x20;Dope&#x20;Analysis)</dcvalue>
</dublin_core>
