기업분석 #6 한국생명공학연구원 #
#2026-03-10
0. F-1 #
모집분야 - 유전체 기반 질환별 유전변이 통합 분석, 유전체 데이터 분석 및 AI 품질관리
전공 - 생명정보학, 생명공학, 유전체학, 생물정보학, 전산학 분야
#
1. 자기소개서 #
#1 지원동기
저는 유전체 데이터 분석과 AI를 결합하여 질병의 기전을 규명하는 연구를 수행해왔습니다. 석사과정 동안 COVID-19 환자 코호트에서 사이토카인 마커를 발굴하고, SARS-CoV-2 유전체에서 중증도 관련 돌연변이 핫스팟을 탐지하며, EBV 양성 위암 환자의 멀티오믹스 데이터를 분석하는 연구에 참여하였습니다. 이 과정에서 개별 연구실의 데이터만으로는 한계가 있으며, 국가 차원에서 체계적으로 축적되고 품질이 관리된 유전체 데이터 인프라가 정밀의료 실현의 핵심이라는 것을 느꼈습니다. 한국생명공학연구원은 국가 바이오 R&D의 중추 기관으로서 유전체 기반 질환별 유전변이 통합 분석과 AI 품질관리 시스템 구축을 추진하고 있습니다. 이는 제가 석사과정에서 경험한 멀티오믹스 통합 분석 역량과 SKALA에서 습득한 AI 모델링 및 데이터 파이프라인 구축 역량을 국가 수준의 인프라 구축에 기여할 수 있는 기회라고 생각하여 지원하게 되었습니다.
저는 질병관리청 협업 과제에서 국립보건연구원(KNIH)의 COVID-19 코호트 데이터를 분석하며, 국가 보건 데이터의 결측값 처리와 품질관리가 연구 결과의 신뢰도에 얼마나 큰 영향을 미치는지 직접 체감하였습니다. 엄격한 필터링 기준을 설계하고 의료 데이터에 적합한 방식으로 데이터 전처리를 수행한 경험은, KRIBB에서 대규모 유전체 데이터의 품질을 체계적으로 관리하는 업무에 직접 활용될 수 있다고 생각합니다. 또한 SKALA 2기에서 BERTops 프로젝트에서 Champion-Challenger 재학습 파이프라인을 구축한 경험은 AI 기반 품질관리 시스템 개발에 기여할 수 있는 역량이라고 생각합니다. 단순히 분석 스크립트를 작성하는 것이 아니라, 지속적으로 데이터 품질을 감시하고 모델 성능을 관리하는 시스템을 설계한 경험이 있기에, KRIBB에서 유전체 데이터의 품질을 자동으로 검증하는 AI 시스템 구축에 기여할 수 있다고 생각합니다.
한국생명공학연구원에서 한국인 맞춤형 정밀의료의 기반이 되는 유전체 데이터 인프라를 구축하는 데 기여하고, 이를 통해 국가 바이오 경쟁력 강화에 일조하는 연구원으로 성장하고 싶습니다.
#
#2 성격의 장단점 및 특기
제 장점은 끈기있는 성격입니다. 컴퓨터학부 석사과정에 진학했을 때, 저는 연구실 내 유일한 비전공자였습니다. 동기들이 당연하게 아는 프로그래밍 문법과 알고리즘 개념을 처음부터 익혀야 했고, 첫 학기에는 코드 한 줄 이해하는 데도 시간이 걸렸습니다. 하지만 모르는 부분이 나올 때마다 그날 안에 해결하겠다는 원칙을 세우고, 논문과 공식 문서를 반복해서 읽으며 부족한 부분을 채워나갔습니다. 그 결과 석사과정을 4.23의 학점으로 마무리하였고, SCI 논문 4편에 기여하며 제1저자 논문도 출판할 수 있었습니다. 한국생명공학연구원에서도 이러한 끈기로 새로운 분석 기법과 도메인 지식을 빠르게 습득하고, 맡은 과제를 끝까지 완수하는 연구원이 되겠습니다.
제 단점은 반박 의견을 내기 어려워한다는 점입니다. 회의 중 더 나은 의견이 떠올라도, 다른 사람의 의견을 정면으로 반박해야 하는 상황에서는 분위기를 해칠까 봐 쉽게 말을 꺼내지 못하는 경향이 있었습니다. 이 단점을 인식한 후, SKALA 2기 팀 프로젝트에서 의식적으로 개선을 시도했습니다. 데이터베이스 선택을 두고 의견이 나뉘었을 때, 운영 복잡도, 개발 기간이라는 두 가지 기준으로 각 선택지의 장단점을 정리하여 제시했습니다. 객관적 근거와 함께 대안을 제안하니 팀원들이 논리적으로 납득하고 수용해주었고, 오히려 “정리를 잘해줘서 결정이 빨라졌다"는 피드백을 받았습니다. 이후로는 반대 의견을 낼 때 반드시 근거와 대안을 함께 준비하는 습관을 들이고 있습니다.
제 특기는 베이킹입니다. 보통 유튜브로 레시피를 찾아서 빵을 굽게 되는데, 단 10g으로도 맛이 달라지고 성공과 실패가 갈리지만 재료와 순서를 파악하고 이를 잘 조합하면 원하는 빵을 만들어낼수 있습니다. 이 과정이 새로운 분석 도구나 알고리즘을 익혀 성과를 내는 생물정보학과 비슷하다고 생각합니다. 하나의 공정도 허투루 넘기지 않는 베이킹의 자세로 꼼꼼히 과제를 완수하는 연구원으로 함께하고 싶습니다.
#
#3 본인의 사회성과 적극성(실제사례 중심)
저는 사회성과 적극성을 바탕으로 연구실 내 유일한 비전공자로서 성공적으로 적응한 경험이 있습니다.
처음 컴퓨터학부 연구실에서 인턴을 시작했을 때 저는 복수전공도 하지 않은 생명공학 전공자였습니다. 해당 학과에 아는 사람이 없어 연구실 내 겹치는 인맥도 전혀 없었고, 프로그래밍 능력도 다른 연구원들에 비해 현저히 부족하여 적응이 쉽지 않았습니다. 하지만 이럴 때일수록 더 적극적으로 다가가야 한다고 생각했습니다. 제 발표 순서가 아니더라도 연구실의 모든 랩미팅에 빠짐없이 참여하여 다른 연구원들의 연구 내용을 경청하고, 모르는 개념이 나오면 미팅이 끝난 후 선배들에게 적극적으로 질문했습니다. 또한 연구실 회식이나 모임에도 빠지지 않고 참석하여 선배들과 편하게 대화할 수 있는 관계를 만들고자 노력했습니다. 업무 외 자리에서 친해지니 연구 관련 질문도 훨씬 편하게 할 수 있었고, 선배들도 처음에는 비전공자인 저를 걱정스러워하셨지만 꾸준히 참여하고 질문하는 모습을 보시며 점차 적극적으로 도움을 주셨습니다.
이러한 노력의 결과, 연구실에서 제 성실함과 열정을 인정받아 동기들 중 가장 많은 3건의 프로젝트에 참여하게 되었고, 최종적으로 SCI 논문 4편에 기여하며 제1저자 논문도 출판할 수 있었습니다.이 경험을 통해 낯선 환경에서도 적극적으로 다가가고 꾸준히 소통하면 신뢰를 얻을 수 있다는 것을 배웠습니다. 한국생명공학연구원에서도 이러한 사회성과 적극성을 바탕으로, 원내 연구팀은 물론 병원, 대학, 기업 등 외부 협력 기관과도 원활하게 소통하며 유전체 데이터 통합 분석 업무에 기여하겠습니다.
#
#4 역경극복사례 및 이를 통해 느낀점
석사과정 중 제1저자 논문을 완성하기까지의 과정이 가장 큰 역경이었습니다.
돌연변이 핫스팟 탐지 알고리즘 연구에 참여했을 때, 알고리즘 개발을 담당하신 박사님께서 건강상의 문제로 장기간 부재하게 되셨습니다. 교수님께서는 해당 프로젝트의 유일한 참여자인 저에게 논문의 Result 섹션 작성을 맡기셨습니다. 비전공자인 데다 논문 작성 경험이 전무한 석사과정 학생에게 주어진 과제였기에, 주변에서는 모두 어려울 것이라 예상했습니다.
하지만 저는 그동안 논문을 읽어온 경험을 바탕으로 기본에 충실해서 접근했습니다. 먼저 이 연구의 방향성과 개발된 알고리즘의 차별점이 무엇인지 스스로 고민했습니다. 관련 논문 수십 편을 읽으며 기존 연구들과의 차이점을 파악하고, 우리 알고리즘의 강점을 부각시킬 수 있는 downstream 분석을 직접 설계했습니다. HLA 결합 친화도 분석, 차등 발현 유전자 분석, 코호트 클러스터링 분석을 결합한 Multi-omics 분석 전략을 기획하고 실행하여, 돌연변이 핫스팟이 면역 반응에 미치는 영향이라는 생물학적 기전을 규명할 수 있었습니다.
작성 과정에서 HLA 분석을 위해 처음 접하는 Docker 환경과 netMHCpan 도구를 독학해야 했고, 분석 결과가 예상과 다르게 나와 처음부터 다시 설계해야 했던 적도 여러 번 있었습니다. 하지만 포기하지 않고 매번 원인을 분석하고 방법을 수정하며 끈기 있게 진행한 결과, 연구의 방향성을 주도적으로 제안하고 핵심 분석을 수행한 기여도를 인정받아 SCIE 논문의 제1저자로 등재될 수 있었습니다.
이 경험을 통해 두 가지를 느꼈습니다. 첫째, 예상치 못한 상황에서도 기본에 충실하면 길이 보인다는 것입니다. 막막한 상황에서 논문의 구조와 논리 전개라는 기본 원칙에 집중하여 해야 할 일을 구체화하고 한 단계씩 나아갈 수 있었습니다. 둘째, 위기는 성장의 기회가 될 수 있다는 것입니다. 박사님의 부재라는 어려운 상황이 오히려 저에게 연구를 주도적으로 이끌어보는 경험을 안겨주었습니다. 한국생명공학연구원에서도 예상치 못한 어려움이 생기더라도 기본에 충실하며 끈기 있게 해결해 나가는 연구원이 되겠습니다.
#
#5 계획하고 있는 장래의 모습과 이를 위한 노력
저의 장기적인 목표는 한국인 맞춤형 정밀의료를 실현하는 데 핵심이 되는 유전체 데이터 인프라를 설계하고 운영하는 전문가가 되는 것입니다. 미국 NIH, 영국 UK Biobank, 일본 ToMMo처럼 선진국들은 이미 자국민 유전체 데이터베이스를 구축하여 정밀의료와 신약개발의 기반으로 활용하고 있습니다. 한국도 이러한 경쟁에서 뒤처지지 않으려면 한국인 특이적 유전변이 정보를 체계적으로 축적하고 품질을 관리하는 전문 인력이 필요합니다. 저는 한국생명공학연구원에서 그 역할을 수행하는 연구원으로 성장하고 싶습니다.
단기적으로는 KRIBB의 유전체 데이터 분석 파이프라인과 품질관리 체계를 깊이 이해하고 실무 역량을 쌓겠습니다. GATK, DeepVariant 등 표준 도구를 익히고, ClinVar, gnomAD 등 공공 데이터베이스 활용 역량을 강화하여 질환별 유전변이 통합 분석 업무에 즉시 기여할 수 있는 연구원이 되겠습니다. 그리고 축적된 실무 경험을 바탕으로 AI 기반 데이터 품질관리 시스템의 고도화를 주도하고 싶습니다. 석사과정에서 Random Forest, SHAP을 활용한 의료 데이터 분석과 SKALA에서 MLOps 파이프라인 구축을 경험했습니다. 이 역량을 발전시켜 대규모 유전체 데이터의 오류를 자동 탐지하고, 품질 기준을 지속적으로 개선하는 시스템을 설계하는 데 기여하겠습니다. 이를 위해 딥러닝 기반 변이 검출 기술과 대용량 데이터 처리 기술(클라우드, HPC)을 꾸준히 학습할 계획입니다.
#
#6 기타 특이사항
제 특이사항은 생명공학과 컴퓨터공학의 융합 역량이라고 생각합니다.
학사과정의 생명공학 지식, 석사과정에서 쌓은 생물정보학 역량에 더해, SK AX AI Leader Academy(SKALA) 2기에서 5개월간 소프트웨어 개발 역량을 추가로 습득하였습니다. FastAPI, PostgreSQL, Docker를 활용한 백엔드 개발과 BERT 기반 분류 모델 구축 및 MLOps 파이프라인 설계를 경험하였습니다. 이를 통해 단순히 분석 스크립트를 작성하는 것을 넘어, 재현 가능하고 확장 가능한 분석 시스템을 설계하는 역량을 갖추게 되었습니다. 이 역량은 KRIBB에서 유전체 데이터 분석 파이프라인과 AI 품질관리 시스템을 구축하는 데 기여할 수 있을 것으로 생각합니다.
#
2. 직무기술서 #
#0 희망하는 연수번호
F-1
#
#1 모집분야 직무에 대해 보유한 지식
[유전체 데이터 분석 파이프라인 구축 역량]
석사과정 동안 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터의 전처리부터 분석까지 전 과정을 직접 수행하였습니다. RNA-seq 분석에서는 FastQC를 활용한 품질 검사, TopHat과 SAMtools를 활용한 정렬, HTSeq을 활용한 정량화, edgeR를 활용한 차등 발현 유전자 분석을 수행하였습니다. BS-seq 분석에서는 Bismark를 활용한 전처리와 methylKit을 활용한 차등 메틸화 영역(DMR) 분석을 수행하였고, ChIP-seq 분석에서는 Bowtie2와 Trimmomatic을 활용한 전처리와 IGV를 활용한 시각화를 수행하였습니다. 이러한 경험을 통해 다양한 유형의 NGS 데이터를 표준 파이프라인으로 처리하고 통합 분석할 수 있는 역량을 갖추게 되었습니다.
[유전변이 분석 및 해석 역량]
SARS-CoV-2 돌연변이 핫스팟 연구에서 22만 건의 유전체 데이터를 수집하고, MAFFT를 활용한 다중 서열 정렬(MSA)을 수행하였습니다. 밀도 기반 클러스터링 알고리즘을 통해 중증도와 관련된 돌연변이 핫스팟을 식별하였으며, netMHCpan을 활용한 HLA 결합 친화도 분석으로 변이가 면역 반응에 미치는 영향을 해석하였습니다. 단순히 변이를 호출하는 것을 넘어, 변이가 질병 진행에 어떤 기전으로 영향을 미치는지를 Multi-omics 관점에서 해석한 경험이 있습니다. 이 역량은 KRIBB에서 질환별 유전변이의 임상적 의미를 판단하고 통합 분석하는 업무에 활용될 수 있다고 생각합니다.
[AI 모델링 및 성능관리 시스템 구축 역량]
COVID-19 사이토카인 마커 발굴 연구에서 의료 데이터의 품질 문제를 체계적으로 관리한 경험이 있습니다. 191개 사이토카인 중 13,203개의 결측값이 존재하는 데이터에서 결측률 15% 미만인 166개 사이토카인만을 포함하는 엄격한 필터링 기준을 설계하고, 비선형 관계를 반영할 수 있는 MissForest로 결측값을 대치하였습니다. 60개 샘플의 소규모 데이터에서 과적합을 방지하기 위해 Random Forest를 선택하고, SHAP TreeExplainer를 활용하여 개인별 사이토카인 중증도 기여도를 분석하였습니다.
SKALA 2기에서는 AI 모델의 품질을 지속적으로 관리하는 MLOps 시스템을 구축하였습니다. Layer specific learning rate 설계 및 비선형 Classifier 설계로 VERT 모델의 분류 성능을 올렸으며, MLflow로 전체 실험을 추적하는 체계를 구성하였습니다. 이러한 경험은 KRIBB에서 대규모 유전체 데이터의 품질을 자동으로 검증하고 관리하는 AI 시스템을 구축하는 데 직접 활용될 수 있다고 생각합니다.
[대용량 데이터 처리 및 시스템 운영 역량]
Linux 환경에서 생물정보학 분석을 수행해 왔으며, Docker를 활용하여 분석 환경을 컨테이너화한 경험이 있습니다. 22만 건의 유전체 데이터를 Selenium으로 크롤링하고 전처리하며 대규모 데이터를 다루는 경험을 쌓았습니다. SKALA에서는 PostgreSQL과 pgvector를 활용한 데이터베이스 설계, 10만 건 규모의 벤치마크 수행, asyncio.gather를 활용한 병렬 처리 최적화 등을 경험하였습니다. 데이터 규모 증가에 따른 성능 변화를 사전에 파악하고 병목을 선제적으로 대응한 경험은, KRIBB에서 국가 수준의 대규모 유전체 데이터를 효율적으로 처리하는 데 기여할 수 있다고 생각합니다.
#
#2 직무에 대한 본인의 적합성(경력 및 역량 중심)
[질환별 유전변이 통합 분석 직무 적합성]
저는 다양한 질환 데이터를 통합 분석하여 생물학적 기전을 규명한 경험이 있습니다. COVID-19 연구에서는 환자 444명의 EHR 데이터와 191개 사이토카인 프로파일을 연계 분석하여 질병 악화 마커를 발굴하였고, SARS-CoV-2 연구에서는 22만 건의 유전체 데이터에서 중증도 관련 돌연변이 핫스팟을 식별하였습니다. EBV 양성 위암 연구에서는 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터를 통합하여 약물 작용 기전을 규명하였습니다. 이처럼 감염병과 암이라는 서로 다른 질환 영역에서 유전체 데이터와 임상 표현형을 연결하여 분석한 경험은, KRIBB에서 질환별 유전변이를 체계적으로 통합 분석하는 업무에 직접 활용될 수 있다고 생각합니다.
[AI 품질관리 직무 적합성]
저는 의료 데이터의 품질 문제를 체계적으로 관리하고, AI 모델의 성능을 지속적으로 유지하는 시스템을 구축한 경험이 있습니다. COVID-19 사이토카인 연구에서 13,203개의 결측값이 존재하는 데이터를 다루며, 결측률 15% 미만 필터링과 MissForest 대치라는 엄격한 품질관리 전략을 설계하였습니다. 이 경험을 통해 의료 데이터에서 품질 기준을 어떻게 설정하고 적용해야 하는지를 체득하였습니다.
SKALA 2기에서는 이러한 품질관리 역량을 시스템 수준으로 확장하였습니다. MLflow로 전체 실험을 추적하는 MLOps 체계를 구축하여 단순히 모델을 만드는 것이 아니라 모델 품질을 지속적으로 관리하는 시스템을 설계한 경험은, KRIBB에서 유전체 데이터의 품질을 자동으로 검증하는 AI 시스템을 구축하는 데 핵심 역량이 될 수 있다고 생각합니다.
[도메인 특성을 고려한 분석 설계 역량]
저의 강점은 도메인의 특성에 맞게 분석 전략을 설계하는 능력입니다. 의료 도메인에서는 오분류가 환자 안전에 직결되므로 Recall과 해석 가능성을 최우선으로 설계하였습니다. COVID-19 연구에서 60개 샘플의 소규모 데이터에서 딥러닝의 과적합이 불가피하다고 판단하여 Random Forest를 선택하고, SHAP TreeExplainer로 개인별 해석이 가능한 분석 결과를 제시하였습니다. B2B 도메인에서는 오탐이 계약 위약금으로 이어지므로 Precision과 SLA 준수를 중심으로 설계하였습니다. 동일한 AI 모델링이라도 도메인에 따라 우선순위가 달라진다는 것을 체감하였고, 그에 맞는 지표 선정, 모델 선택, 검증 방식을 설계할 수 있는 역량을 갖추게 되었습니다. 이 역량은 KRIBB에서 국가 유전체 데이터라는 공공 도메인의 특성에 맞는 품질관리 전략을 설계하는 데 활용될 수 있다고 생각합니다.
[국가 기관 협업 및 다학제 소통 역량]
저는 이미 국가 기관 및 외부 연구기관과 협업하여 연구를 완수한 경험이 있습니다. 질병관리청 협업 과제에서 국립보건연구원(KNIH)의 COVID-19 코호트 데이터를 분석하였고, 경북대학교 약학대학과 협업하여 EBV 양성 위암 연구를 수행하였습니다. SKALA 2기에서는 6인 팀 프로젝트에서 GitHub 브랜치 전략과 Jira를 활용한 체계적인 협업을 경험하였고, 의견 충돌 시 객관적 기준으로 비교하여 합리적으로 조율하는 방법을 배웠습니다. 이러한 협업 경험은 KRIBB에서 원내 연구팀은 물론 외부 병원, 대학, 기업 연구자들과 소통하며 유전체 데이터 인프라를 구축하는 데 기여할 수 있다고 생각합니다.
#
#3 직무와 관련된 경력/교육/기타 사례
[연구 경력]
경북대학교 Computational Biology Lab(COBI)에서 약 3년 6개월간 인턴 및 석사과정을 수행하며 3건의 연구 프로젝트에 참여하였습니다.
첫 번째로, SARS-CoV-2 유전체에서 중증도 관련 돌연변이 핫스팟을 탐지하는 클러스터링 알고리즘 연구를 수행하였습니다. Selenium을 활용하여 22만 건의 유전체 데이터를 크롤링하고 MAFFT로 다중 서열 정렬을 수행하였으며, Docker와 netMHCpan을 활용한 HLA 결합 친화도 분석, edgeR를 활용한 차등 발현 유전자 분석, 코호트 클러스터링과 ANOVA 통계 분석을 수행하였습니다. HLA, 네트워크, DEG 분석을 결합한 Multi-omics 분석 전략을 직접 설계하여 면역학적 기전을 규명하였고, 연구 방향성을 주도적으로 제안한 기여도를 인정받아 SCIE 논문(BioData Mining, IF 6.1)의 제1저자로 등재되었습니다.
두 번째로, 질병관리청 협업 과제인 COVID-19 질병 진행 모델링 연구에 참여하였습니다. 국립보건연구원(KNIH)의 COVID-19 코호트 데이터를 활용하여 환자 444명의 EHR 데이터와 191개 사이토카인 발현 프로파일을 분석하였습니다. 13,203개의 결측값이 존재하는 데이터에서 결측률 15% 미만인 166개 사이토카인만을 포함하는 엄격한 필터링을 적용하고 MissForest로 결측값을 대치하였습니다. 60개 샘플의 소규모 데이터에서 Random Forest를 선택하고 SHAP TreeExplainer로 개인별 사이토카인 중증도 기여도를 분석하여 악화 마커를 발굴하였습니다.
세 번째로, 경북대학교 약학대학과 협업하여 EBV 양성 위암 환자에서 DHT 약물의 작용 기전을 규명하는 멀티오믹스 연구를 수행하였습니다. RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터의 전처리와 분석을 전담하였습니다. FastQC, TopHat, SAMtools, HTSeq을 활용한 RNA-seq 전처리, Bismark를 활용한 BS-seq 전처리, Bowtie2와 Trimmomatic을 활용한 ChIP-seq 전처리를 수행하였고, edgeR를 활용한 DEG 분석, methylKit을 활용한 DMR 분석, IGV를 활용한 ChIP-seq 시각화를 수행하였습니다.
[교육 이수]
SK AX AI Leader Academy(SKALA) 2기에서 5개월간 AI 서비스 개발 교육을 이수하였습니다. 프론트엔드, 백엔드, 데이터베이스, AI 모델링, LLM 등 서비스 개발에 필요한 기술 스택을 습득하였으며, 8주간의 최종 프로젝트에서 AI 서비스의 기획부터 개발, 성능 최적화까지 전체 사이클을 경험하였습니다.
최종 프로젝트로 4개 플랫폼의 업무 데이터를 통합하여 주간업무 보고서를 자동 생성하는 B2B AI 서비스를 6인 팀으로 개발하였으며, DB 설계와 API 개발을 담당하였습니다. PostgreSQL과 pgvector로 관계형 데이터와 벡터 검색을 단일 DB에서 처리하는 구조를 설계하고, Redis 캐싱으로 반복 조회를 217ms에서 2ms로 개선, asyncio.gather 병렬 처리로 타임라인 조회를 1.56배 단축, BackgroundTasks로 리포트 P95를 178ms에서 60ms로 안정화하여 전체 엔드포인트에서 B2B SLA 기준을 충족하였습니다.
개인 프로젝트로 BERT 기반 뉴스 분류 모델을 구축하고 B2B SLA를 충족하는 서빙 및 모니터링 체계를 구축하였습니다. Null Model부터 변수를 순차 변경하며 F1을 91.46%에서 94.75%로 개선하고, M1 CPU 환경에서 ONNX 변환으로 P95 76.9ms를 달성하였습니다. Champion-Challenger 재학습 파이프라인을 구축하여 모델 성능을 지속적으로 관리하는 MLOps 체계를 구성하였습니다.
#
#4 임용시 직무 수행계획
입사 초기에는 한국생명공학연구원의 유전체 데이터 분석 체계와 품질관리 프로세스를 깊이 이해하는 데 집중하겠습니다. 기존에 구축된 분석 파이프라인과 데이터베이스 구조를 파악하고, 원내 연구원들과의 소통을 통해 현재 업무의 흐름과 개선이 필요한 부분을 파악하겠습니다. 또한 GATK, DeepVariant 등 표준 변이 호출 도구를 익히고, ClinVar, gnomAD, KRGDB 등 공공 데이터베이스 활용 역량을 강화하여 질환별 유전변이 통합 분석 업무에 즉시 기여할 수 있는 기반을 마련하겠습니다.
기반 역량을 갖춘 후에는 질환별 유전변이 통합 분석 업무에 본격적으로 참여하겠습니다. 석사과정에서 COVID-19, SARS-CoV-2, EBV 양성 위암 등 서로 다른 질환 영역의 데이터를 분석하며 임상 표현형과 유전체 데이터를 연계하는 경험을 쌓았습니다. 이 경험을 바탕으로 다양한 질환군의 유전변이 데이터를 체계적으로 수집하고, 변이의 병원성을 판단하며, 임상적 의미를 해석하는 업무를 수행하겠습니다. 특히 멀티오믹스 통합 분석 역량을 활용하여 유전체 데이터만으로는 파악하기 어려운 변이의 기능적 영향을 전사체, 후성유전체 데이터와 연계하여 분석하는 데 기여하겠습니다.
유전변이 분석 업무에 숙련된 후에는 AI 기반 데이터 품질관리 시스템 구축에 기여하고 싶습니다. 구체적으로는 시퀀싱 데이터의 품질 지표를 자동으로 모니터링하고, 변이 호출 결과의 정확도를 검증하며, 배치 효과나 이상치를 탐지하는 AI 모델 개발에 기여하겠습니다. 단순히 분석 스크립트를 작성하는 것이 아니라, 지속적으로 데이터 품질을 감시하고 문제를 선제적으로 대응하는 시스템을 구축하는 데 역량을 발휘하겠습니다.
#
#cf
너무 쓰기싫어서 다 클로드 돌렸는데 다시 보니까 너무너무 티나넹………. 좀만 일찍 쓸걸!!!!!!