<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Park,&#x20;Hana</dcvalue>
<dcvalue element="contributor" qualifier="author">Son,&#x20;Jung&#x20;hyun</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-12-03T06:00:26Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-12-03T06:00:26Z</dcvalue>
<dcvalue element="date" qualifier="created">2024-11-26</dcvalue>
<dcvalue element="date" qualifier="issued">2024-11-21</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;151271</dcvalue>
<dcvalue element="description" qualifier="abstract">Doping&#x20;testing&#x20;in&#x20;sports&#x20;presents&#x20;significant&#x20;analytical&#x20;challenges&#x20;due&#x20;to&#x20;the&#x20;vast&#x20;array&#x20;of&#x20;banned&#x20;substances&#x20;and&#x20;the&#x20;large&#x20;volume&#x20;of&#x20;samples&#x20;requiring&#x20;analysis.&#x20;Identifying&#x20;a&#x20;positivity&#x20;rate&#x20;as&#x20;low&#x20;as&#x20;1%&#x20;from&#x20;extensive&#x20;datasets&#x20;is&#x20;particularly&#x20;demanding.&#x20;In&#x20;this&#x20;study,&#x20;we&#x20;developed&#x20;and&#x20;applied&#x20;an&#x20;artificial&#x20;intelligence&#x20;(AI)-based&#x20;diagnostic&#x20;system&#x20;to&#x20;automate&#x20;the&#x20;analysis&#x20;of&#x20;mass&#x20;spectrometry&#x20;(MS)&#x20;data&#x20;for&#x20;detecting&#x20;doping&#x20;substances.&#x20;The&#x20;AI&#x20;algorithm&#x20;classifies&#x20;samples&#x20;by&#x20;analyzing&#x20;peak&#x20;areas&#x20;corresponding&#x20;to&#x20;the&#x20;retention&#x20;times&#x20;of&#x20;detected&#x20;compounds.&#x20;A&#x20;total&#x20;of&#x20;684&#x20;athlete&#x20;urine&#x20;samples―643&#x20;negative&#x20;and&#x20;41&#x20;positive―were&#x20;analyzed&#x20;using&#x20;gas&#x20;chromatography&#x20;coupled&#x20;with&#x20;tandem&#x20;mass&#x20;spectrometry&#x20;(GC-MS&#x2F;MS)&#x20;to&#x20;detect&#x20;153&#x20;banned&#x20;substances.&#x20;We&#x20;trained&#x20;six&#x20;different&#x20;machine&#x20;learning&#x20;models―logistic&#x20;regression,&#x20;K-nearest&#x20;neighbor&#x20;(KNN),&#x20;support&#x20;vector&#x20;machine&#x20;(SVM),&#x20;Gaussian&#x20;Naive&#x20;Bayes,&#x20;random&#x20;forest&#x20;(RF),&#x20;and&#x20;extreme&#x20;gradient&#x20;boosting―using&#x20;both&#x20;K-fold&#x20;cross-validation&#x20;and&#x20;leave-one-out&#x20;cross-validation&#x20;(LOOCV).&#x20;The&#x20;RF&#x20;and&#x20;KNN&#x20;models&#x20;trained&#x20;using&#x20;LOOCV&#x20;achieved&#x20;precision,&#x20;recall,&#x20;accuracy,&#x20;and&#x20;F1&#x20;scores&#x20;of&#x20;100%.&#x20;LOOCV&#x20;demonstrated&#x20;superior&#x20;capability&#x20;in&#x20;addressing&#x20;sample&#x20;imbalance&#x20;issues,&#x20;significantly&#x20;enhancing&#x20;the&#x20;system’s&#x20;ability&#x20;to&#x20;detect&#x20;rare&#x20;positive&#x20;cases,&#x20;as&#x20;compared&#x20;to&#x20;K-fold&#x20;cross-validation.&#x20;This&#x20;AI-based&#x20;approach&#x20;substantially&#x20;reduces&#x20;manual&#x20;effort,&#x20;accelerates&#x20;the&#x20;speed&#x20;and&#x20;consistency&#x20;of&#x20;doping&#x20;testing,&#x20;and&#x20;minimizes&#x20;human&#x20;errors.&#x20;The&#x20;study&#x20;underscores&#x20;the&#x20;potential&#x20;of&#x20;LOOCV&#x20;to&#x20;improve&#x20;analytical&#x20;methods,&#x20;particularly&#x20;in&#x20;the&#x20;context&#x20;of&#x20;complex&#x20;and&#x20;imbalanced&#x20;datasets&#x20;common&#x20;in&#x20;anti-doping&#x20;analyses.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">한국분석과학회&#x20;(The&#x20;Korean&#x20;Society&#x20;of&#x20;Analytical&#x20;Sciences)</dcvalue>
<dcvalue element="title" qualifier="none">AI-Driven&#x20;Doping&#x20;Detection&#x20;Using&#x20;LOOCV&#x20;to&#x20;Address&#x20;Data&#x20;Imbalance&#x20;in&#x20;Mass&#x20;Spectrometry&#x20;Analysis</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="description" qualifier="journalClass">2</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">제73회&#x20;한국분석과학회&#x20;추계학술대회&#x20;(The&#x20;73th&#x20;Biannual&#x20;Conference&#x20;for&#x20;The&#x20;Korean&#x20;Society&#x20;of&#x20;Analytical&#x20;Sciences)</dcvalue>
<dcvalue element="citation" qualifier="title">제73회&#x20;한국분석과학회&#x20;추계학술대회&#x20;(The&#x20;73th&#x20;Biannual&#x20;Conference&#x20;for&#x20;The&#x20;Korean&#x20;Society&#x20;of&#x20;Analytical&#x20;Sciences)</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">KO</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">제주&#x20;부영호텔</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2024-11-20</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">제73회&#x20;&#x20;한국분석과학회&#x20;추계&#x20;학술대회</dcvalue>
</dublin_core>
