취업
#
2026-03-11 ⋯ 기업분석 #7 국립암센터
1. 직무 소개 직무: 국립암센터 암빅데이터센터의 유전체 데이터 인프라 구축 및 표준화. 국립암센터는 전국 10개 의료기관과 함께 암 빅데이터 네트워크를 구성하여 국가 암 DB를 구축하고 있으며, 정밀의학 실현과 AI·빅데이터 기반 암 연구를 4대 중점 연구주제로 추진하고 있습니다. 이 공고의 담당업무인 "NGS 패널 기반 유전체 데이터 관리", "VCF/MAF 멀티오믹스 분석", "유전체 데이터의 정제 및 데이터베이스화"는 사실상 이 국가 단위 데이터 플랫폼의 유전체 부문 핵심 인프라를 만들고 운영하는 일입니다. 구체적으로 이 지원자에게 기대하는 역할은 다음과 같을 것입니다: 첫째, 유전체 데이터 표준화 및 품질관리 전문가. 국립암센터 내부는 물론 전국 10개 협력 의료기관에서 수집되는 다양한 형식의 NGS 데이터(패널 기반, WGS, WES, WTS)를 일관된 표준으로 정제하는 역할입니다. VCF → MAF 변환, 참조유전체 버전 통일(GRCh37 ↔ GRCh38 Lift-over), 체세포·생식세포 변이의 public DB annotation 등은 모두 다기관 데이터 통합과 국제 공동연구를 위한 필수 전처리 작업입니다. 이 표준화가 제대로 이루어지지 않으면 향후 AI 모델 학습이나 대규모 코호트 연구에서 데이터 품질 문제가 발생합니다. 둘째, 국가 암 유전체 데이터베이스의 실질적 구축자. 국립암센터가 추진 중인 '차세대 정보시스템 구축사업'의 유전체 부문을 실무적으로 구현하는 역할입니다. 단순히 데이터를 저장하는 것이 아니라, 연구자들이 검색·활용할 수 있는 형태로 DB를 설계하고, 임상정보와 연계하여 재현 가능한 분석이 가능하도록 데이터 구조를 정립해야 합니다. 이것이 "데이터구축팀" 소속인 이유입니다. 셋째, 연구 성과 창출과 사업 운영 지원의 이중 역할. 공고에 "데이터 분석 후 논문 작성 및 발표"와 "보고서, 매뉴얼 작성"이 함께 명시된 점은 주목할 만합니다. 이 포지션은 순수 연구직이 아니라, 인프라 구축(사업)과 연구를 동시에 수행하는 하이브리드 역할입니다. 구축한 데이터를 활용해 연구 논문을 발표하면서, 동시에 사업 보고서와 운영 매뉴얼을 작성하여 지속 가능한 시스템을 만들어야 합니다. 2. 핵심 역량 기술적 역량 NGS 데이터 전처리 및 파이프라인 운영 능력: WGS, WES, Targeted seq 데이터의 생성 원리부터 QC, alignment, variant calling까지의 전체 흐름을 이해하고, 이를 자동화된 파이프라인으로 구축·운영할 수 있는 능력입니다. 국립암센터는 다양한 암종에서 대규모 데이터가 생성되므로, 수작업이 아닌 재현 가능하고 확장 가능한 파이프라인이 필수적입니다. 변이 데이터 처리 및 annotation 역량: VCF/MAF 포맷 구조를 깊이 이해하고, vcf2maf, ANNOVAR, VEP 등 도구를 활용하여 체세포·생식세포 변이를 분류하고, ClinVar, COSMIC, gnomAD, OncoKB 등 public DB와 연계하여 임상적 의미를 부여할 수 있는 능력입니다. 공고에서 "체세포 및 생식세포 변이 public DB annotation"을 명시한 것은 이 역량의 중요성을 보여줍니다.
참조유전체 관리 및 좌표 변환 능력: 다기관에서 수집되는 데이터는 참조유전체 버전이 다를 수 있으므로, GRCh37 ↔ GRCh38 간 Lift-over의 원리와 주의점을 숙지하고 대규모 데이터에 적용할 수 있어야 합니다. 이것이 데이터 통합의 기본 전제조건입니다. Linux 환경에서의 대용량 데이터 처리: 국가 단위 암 데이터는 테라바이트 이상의 규모이므로, HPC 환경이나 서버 기반에서 대용량 파일을 효율적으로 처리하고, 스크립트를 작성하여 반복 작업을 자동화할 수 있는 능력이 필요합니다.
R/Python 프로그래밍: 데이터 정제, 품질 검증, 통계 분석, 시각화를 위한 코딩 역량입니다. 특히 논문 작성이 업무에 포함되어 있으므로, 분석 결과를 publication quality의 그래프로 표현할 수 있어야 합니다. 비기술적 역량 데이터 품질에 대한 강박적 꼼꼼함: 이 직무의 본질은 연구가 아니라 인프라 구축입니다. 사소한 포맷 오류, 좌표 불일치, annotation 누락이 향후 대규모 연구에서 치명적 문제로 이어질 수 있습니다. "데이터 관리"라는 표현이 반복적으로 등장하는 이유가 여기에 있습니다. 분석의 화려함보다 일관성과 정확성에 대한 집착이 더 중요합니다. 문서화 및 표준화 역량: 공고에 "보고서, 매뉴얼 작성"이 명시된 점은 간과하기 쉽지만 핵심적입니다. 국립암센터는 국가기관으로서 사업 성과를 정부에 보고해야 하고, 다기관 협력을 위해 데이터 표준과 운영 프로토콜을 문서화해야 합니다. 또한 담당자가 바뀌어도 시스템이 유지되려면 재현 가능한 SOP(표준운영절차)가 필수입니다. 협업 및 소통 역량: 암빅데이터센터는 연구소, 부속병원, 국가암관리사업본부와 모두 연계되어 있습니다. 임상의가 생성한 데이터를 받아 정제하고, 연구자가 활용할 수 있는 형태로 제공해야 하므로, 비생물정보학 전공자와도 원활하게 소통할 수 있어야 합니다. 특히 전국 10개 의료기관과의 데이터 표준 협의에서 기술적 내용을 명확하게 전달하는 능력이 중요합니다. 공공기관 마인드셋: 국립암센터는 민간 바이오텍이나 대학 연구실과 달리 국가암관리의 책임을 진 공공기관입니다. 개인 연구 성과보다 지속 가능한 국가 자산을 만든다는 관점이 필요합니다. 데이터의 장기 보존, 타 기관과의 공유, 정보보안 등 공공성에 대한 이해가 요구됩니다. 3. 관련 개념 VCF(Variant Call Format) - VCF(Variant Call Format)는 개별 샘플에서 발견된 유전체 변이를 기록하는 파일 형식
- MAF(Mutation Annotation Format)는 여러 샘플의 변이를 통합하고, 각 변이에 유전자명, 단백질 변화, 임상적 의미 등의 annotation을 추가한 형식
- VCF to MAF 변환
1) VCF와 annotation 데이터베이스의 reference를 맞추고 annotation을 수행. 가장 많이 사용되는 도구는 VEP(Variant Effect Predictor)
2) annotation 된 VCF를 AMF 형식으로 변환. vcf2maf 도구를 사용.
3) 추가 컬럼으로 체세포 vs 생식세포 변이 분류 / Public DB annotation 추가 / 최종 MAF 파일의 품질을 검증. Lift-over - Lift-over: 한 참조유전체 버전의 좌표를 다른 버전의 좌표로 변환하는 작업
- Chain 파일: 두 참조유전체 버전 간의 서열 대응 관계를 기록한 매핑 파일 (UCSC Genome Browser에서 hg19ToHg38.over.chain.gz 같은 형식으로 제공)
- Lift over 작업
1) Lift-over할 파일 (VCF, BED 등) 준비
2) Lift-over 수행: 가장 많이 사용되는 도구는 UCSC liftOver와 CrossMap.
3) 변환 실패 케이스 처리, 변환 결과 검증 변이 Annotation - 변이 Annotation: VCF 파일에는 “chr1:12345에서 A가 G로 바뀌었다"는 정보만 있는데, Annotation은 이 변이에 생물학적 의미를 부여하는 작업.
- 어떤 유전자에 위치하는지, 엑손인지 인트론인지, 아미노산이 바뀌는지, 그 변화가 단백질 기능에 해로운지, 다른 환자에서도 발견된 변이인지 등의 정보를 추가한다.
- Annotation 수행
1) 캐시 데이터 다운로드: 유전자 정보, 전사체 정보, 단백질 서열 등의 정보. VEP(Variant Effect Predictor)의 경우 homo_sapiens_vep_110_GRCh38.tar.gz 같은 파일을 다운로드하여 지정된 경로에 설치한다.
2) 툴을 실행해서 각 변이가 어떤 전사체(transcript)의 어떤 위치에 해당하는지 계산한다.
3) 결과에서 변이의 consequence(결과/영향)를 확인한다.
- onsense_variant(stop_gained)는 조기 종결 코돈이 생기는 것, frameshift_variant는 삽입/결실로 읽기 틀이 바뀌는 것, synonymous_variant는 아미노산 변화 없이 코돈만 바뀌는 것.
4) 임상적 해석을 위해 공개 데이터베이스 정보를 추가.
- ClinVar는 변이의 임상적 의미 제공
- COSMIC(Catalogue of Somatic Mutations in Cancer)은 해당 변이가 다른 암 환자에서 몇 번 발견되었는지, 어떤 암종에서 흔한지 정보를 제공 (빈번하게 발견되는 변이는 driver mutation일 가능성이 높다)
- gnomAD(Genome Aggregation Database)는 일반 인구에서의 변이 빈도를 제공
2026-03-10 ⋯ 기업분석 #6 한국생명공학연구원
0. F-1 모집분야 - 유전체 기반 질환별 유전변이 통합 분석, 유전체 데이터 분석 및 AI 품질관리 전공 - 생명정보학, 생명공학, 유전체학, 생물정보학, 전산학 분야 1. 자기소개서 지원동기 저는 유전체 데이터 분석과 AI를 결합하여 질병의 기전을 규명하는 연구를 수행해왔습니다. 석사과정 동안 COVID-19 환자 코호트에서 사이토카인 마커를 발굴하고, SARS-CoV-2 유전체에서 중증도 관련 돌연변이 핫스팟을 탐지하며, EBV 양성 위암 환자의 멀티오믹스 데이터를 분석하는 연구에 참여하였습니다. 이 과정에서 개별 연구실의 데이터만으로는 한계가 있으며, 국가 차원에서 체계적으로 축적되고 품질이 관리된 유전체 데이터 인프라가 정밀의료 실현의 핵심이라는 것을 느꼈습니다. 한국생명공학연구원은 국가 바이오 R&D의 중추 기관으로서 유전체 기반 질환별 유전변이 통합 분석과 AI 품질관리 시스템 구축을 추진하고 있습니다. 이는 제가 석사과정에서 경험한 멀티오믹스 통합 분석 역량과 SKALA에서 습득한 AI 모델링 및 데이터 파이프라인 구축 역량을 국가 수준의 인프라 구축에 기여할 수 있는 기회라고 생각하여 지원하게 되었습니다. 저는 질병관리청 협업 과제에서 국립보건연구원(KNIH)의 COVID-19 코호트 데이터를 분석하며, 국가 보건 데이터의 결측값 처리와 품질관리가 연구 결과의 신뢰도에 얼마나 큰 영향을 미치는지 직접 체감하였습니다. 엄격한 필터링 기준을 설계하고 의료 데이터에 적합한 방식으로 데이터 전처리를 수행한 경험은, KRIBB에서 대규모 유전체 데이터의 품질을 체계적으로 관리하는 업무에 직접 활용될 수 있다고 생각합니다. 또한 SKALA 2기에서 BERTops 프로젝트에서 Champion-Challenger 재학습 파이프라인을 구축한 경험은 AI 기반 품질관리 시스템 개발에 기여할 수 있는 역량이라고 생각합니다. 단순히 분석 스크립트를 작성하는 것이 아니라, 지속적으로 데이터 품질을 감시하고 모델 성능을 관리하는 시스템을 설계한 경험이 있기에, KRIBB에서 유전체 데이터의 품질을 자동으로 검증하는 AI 시스템 구축에 기여할 수 있다고 생각합니다. 한국생명공학연구원에서 한국인 맞춤형 정밀의료의 기반이 되는 유전체 데이터 인프라를 구축하는 데 기여하고, 이를 통해 국가 바이오 경쟁력 강화에 일조하는 연구원으로 성장하고 싶습니다. 성격의 장단점 및 특기 제 장점은 끈기있는 성격입니다. 컴퓨터학부 석사과정에 진학했을 때, 저는 연구실 내 유일한 비전공자였습니다. 동기들이 당연하게 아는 프로그래밍 문법과 알고리즘 개념을 처음부터 익혀야 했고, 첫 학기에는 코드 한 줄 이해하는 데도 시간이 걸렸습니다. 하지만 모르는 부분이 나올 때마다 그날 안에 해결하겠다는 원칙을 세우고, 논문과 공식 문서를 반복해서 읽으며 부족한 부분을 채워나갔습니다. 그 결과 석사과정을 4.23의 학점으로 마무리하였고, SCI 논문 4편에 기여하며 제1저자 논문도 출판할 수 있었습니다. 한국생명공학연구원에서도 이러한 끈기로 새로운 분석 기법과 도메인 지식을 빠르게 습득하고, 맡은 과제를 끝까지 완수하는 연구원이 되겠습니다. 제 단점은 반박 의견을 내기 어려워한다는 점입니다. 회의 중 더 나은 의견이 떠올라도, 다른 사람의 의견을 정면으로 반박해야 하는 상황에서는 분위기를 해칠까 봐 쉽게 말을 꺼내지 못하는 경향이 있었습니다. 이 단점을 인식한 후, SKALA 2기 팀 프로젝트에서 의식적으로 개선을 시도했습니다. 데이터베이스 선택을 두고 의견이 나뉘었을 때, 운영 복잡도, 개발 기간이라는 두 가지 기준으로 각 선택지의 장단점을 정리하여 제시했습니다. 객관적 근거와 함께 대안을 제안하니 팀원들이 논리적으로 납득하고 수용해주었고, 오히려 "정리를 잘해줘서 결정이 빨라졌다"는 피드백을 받았습니다. 이후로는 반대 의견을 낼 때 반드시 근거와 대안을 함께 준비하는 습관을 들이고 있습니다. 제 특기는 베이킹입니다. 보통 유튜브로 레시피를 찾아서 빵을 굽게 되는데, 단 10g으로도 맛이 달라지고 성공과 실패가 갈리지만 재료와 순서를 파악하고 이를 잘 조합하면 원하는 빵을 만들어낼수 있습니다. 이 과정이 새로운 분석 도구나 알고리즘을 익혀 성과를 내는 생물정보학과 비슷하다고 생각합니다. 하나의 공정도 허투루 넘기지 않는 베이킹의 자세로 꼼꼼히 과제를 완수하는 연구원으로 함께하고 싶습니다. 본인의 사회성과 적극성(실제사례 중심) 저는 사회성과 적극성을 바탕으로 연구실 내 유일한 비전공자로서 성공적으로 적응한 경험이 있습니다. 처음 컴퓨터학부 연구실에서 인턴을 시작했을 때 저는 복수전공도 하지 않은 생명공학 전공자였습니다. 해당 학과에 아는 사람이 없어 연구실 내 겹치는 인맥도 전혀 없었고, 프로그래밍 능력도 다른 연구원들에 비해 현저히 부족하여 적응이 쉽지 않았습니다. 하지만 이럴 때일수록 더 적극적으로 다가가야 한다고 생각했습니다. 제 발표 순서가 아니더라도 연구실의 모든 랩미팅에 빠짐없이 참여하여 다른 연구원들의 연구 내용을 경청하고, 모르는 개념이 나오면 미팅이 끝난 후 선배들에게 적극적으로 질문했습니다. 또한 연구실 회식이나 모임에도 빠지지 않고 참석하여 선배들과 편하게 대화할 수 있는 관계를 만들고자 노력했습니다. 업무 외 자리에서 친해지니 연구 관련 질문도 훨씬 편하게 할 수 있었고, 선배들도 처음에는 비전공자인 저를 걱정스러워하셨지만 꾸준히 참여하고 질문하는 모습을 보시며 점차 적극적으로 도움을 주셨습니다. 이러한 노력의 결과, 연구실에서 제 성실함과 열정을 인정받아 동기들 중 가장 많은 3건의 프로젝트에 참여하게 되었고, 최종적으로 SCI 논문 4편에 기여하며 제1저자 논문도 출판할 수 있었습니다.이 경험을 통해 낯선 환경에서도 적극적으로 다가가고 꾸준히 소통하면 신뢰를 얻을 수 있다는 것을 배웠습니다. 한국생명공학연구원에서도 이러한 사회성과 적극성을 바탕으로, 원내 연구팀은 물론 병원, 대학, 기업 등 외부 협력 기관과도 원활하게 소통하며 유전체 데이터 통합 분석 업무에 기여하겠습니다. 역경극복사례 및 이를 통해 느낀점 석사과정 중 제1저자 논문을 완성하기까지의 과정이 가장 큰 역경이었습니다. 돌연변이 핫스팟 탐지 알고리즘 연구에 참여했을 때, 알고리즘 개발을 담당하신 박사님께서 건강상의 문제로 장기간 부재하게 되셨습니다. 교수님께서는 해당 프로젝트의 유일한 참여자인 저에게 논문의 Result 섹션 작성을 맡기셨습니다. 비전공자인 데다 논문 작성 경험이 전무한 석사과정 학생에게 주어진 과제였기에, 주변에서는 모두 어려울 것이라 예상했습니다. 하지만 저는 그동안 논문을 읽어온 경험을 바탕으로 기본에 충실해서 접근했습니다. 먼저 이 연구의 방향성과 개발된 알고리즘의 차별점이 무엇인지 스스로 고민했습니다. 관련 논문 수십 편을 읽으며 기존 연구들과의 차이점을 파악하고, 우리 알고리즘의 강점을 부각시킬 수 있는 downstream 분석을 직접 설계했습니다. HLA 결합 친화도 분석, 차등 발현 유전자 분석, 코호트 클러스터링 분석을 결합한 Multi-omics 분석 전략을 기획하고 실행하여, 돌연변이 핫스팟이 면역 반응에 미치는 영향이라는 생물학적 기전을 규명할 수 있었습니다. 작성 과정에서 HLA 분석을 위해 처음 접하는 Docker 환경과 netMHCpan 도구를 독학해야 했고, 분석 결과가 예상과 다르게 나와 처음부터 다시 설계해야 했던 적도 여러 번 있었습니다. 하지만 포기하지 않고 매번 원인을 분석하고 방법을 수정하며 끈기 있게 진행한 결과, 연구의 방향성을 주도적으로 제안하고 핵심 분석을 수행한 기여도를 인정받아 SCIE 논문의 제1저자로 등재될 수 있었습니다. 이 경험을 통해 두 가지를 느꼈습니다. 첫째, 예상치 못한 상황에서도 기본에 충실하면 길이 보인다는 것입니다. 막막한 상황에서 논문의 구조와 논리 전개라는 기본 원칙에 집중하여 해야 할 일을 구체화하고 한 단계씩 나아갈 수 있었습니다. 둘째, 위기는 성장의 기회가 될 수 있다는 것입니다. 박사님의 부재라는 어려운 상황이 오히려 저에게 연구를 주도적으로 이끌어보는 경험을 안겨주었습니다. 한국생명공학연구원에서도 예상치 못한 어려움이 생기더라도 기본에 충실하며 끈기 있게 해결해 나가는 연구원이 되겠습니다. 계획하고 있는 장래의 모습과 이를 위한 노력 저의 장기적인 목표는 한국인 맞춤형 정밀의료를 실현하는 데 핵심이 되는 유전체 데이터 인프라를 설계하고 운영하는 전문가가 되는 것입니다. 미국 NIH, 영국 UK Biobank, 일본 ToMMo처럼 선진국들은 이미 자국민 유전체 데이터베이스를 구축하여 정밀의료와 신약개발의 기반으로 활용하고 있습니다. 한국도 이러한 경쟁에서 뒤처지지 않으려면 한국인 특이적 유전변이 정보를 체계적으로 축적하고 품질을 관리하는 전문 인력이 필요합니다. 저는 한국생명공학연구원에서 그 역할을 수행하는 연구원으로 성장하고 싶습니다. 단기적으로는 KRIBB의 유전체 데이터 분석 파이프라인과 품질관리 체계를 깊이 이해하고 실무 역량을 쌓겠습니다. GATK, DeepVariant 등 표준 도구를 익히고, ClinVar, gnomAD 등 공공 데이터베이스 활용 역량을 강화하여 질환별 유전변이 통합 분석 업무에 즉시 기여할 수 있는 연구원이 되겠습니다. 그리고 축적된 실무 경험을 바탕으로 AI 기반 데이터 품질관리 시스템의 고도화를 주도하고 싶습니다. 석사과정에서 Random Forest, SHAP을 활용한 의료 데이터 분석과 SKALA에서 MLOps 파이프라인 구축을 경험했습니다. 이 역량을 발전시켜 대규모 유전체 데이터의 오류를 자동 탐지하고, 품질 기준을 지속적으로 개선하는 시스템을 설계하는 데 기여하겠습니다. 이를 위해 딥러닝 기반 변이 검출 기술과 대용량 데이터 처리 기술(클라우드, HPC)을 꾸준히 학습할 계획입니다. 기타 특이사항 제 특이사항은 생명공학과 컴퓨터공학의 융합 역량이라고 생각합니다. 학사과정의 생명공학 지식, 석사과정에서 쌓은 생물정보학 역량에 더해, SK AX AI Leader Academy(SKALA) 2기에서 5개월간 소프트웨어 개발 역량을 추가로 습득하였습니다. FastAPI, PostgreSQL, Docker를 활용한 백엔드 개발과 BERT 기반 분류 모델 구축 및 MLOps 파이프라인 설계를 경험하였습니다. 이를 통해 단순히 분석 스크립트를 작성하는 것을 넘어, 재현 가능하고 확장 가능한 분석 시스템을 설계하는 역량을 갖추게 되었습니다. 이 역량은 KRIBB에서 유전체 데이터 분석 파이프라인과 AI 품질관리 시스템을 구축하는 데 기여할 수 있을 것으로 생각합니다. 2. 직무기술서 희망하는 연수번호 F-1 모집분야 직무에 대해 보유한 지식 [유전체 데이터 분석 파이프라인 구축 역량] 석사과정 동안 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터의 전처리부터 분석까지 전 과정을 직접 수행하였습니다. RNA-seq 분석에서는 FastQC를 활용한 품질 검사, TopHat과 SAMtools를 활용한 정렬, HTSeq을 활용한 정량화, edgeR를 활용한 차등 발현 유전자 분석을 수행하였습니다. BS-seq 분석에서는 Bismark를 활용한 전처리와 methylKit을 활용한 차등 메틸화 영역(DMR) 분석을 수행하였고, ChIP-seq 분석에서는 Bowtie2와 Trimmomatic을 활용한 전처리와 IGV를 활용한 시각화를 수행하였습니다. 이러한 경험을 통해 다양한 유형의 NGS 데이터를 표준 파이프라인으로 처리하고 통합 분석할 수 있는 역량을 갖추게 되었습니다. [유전변이 분석 및 해석 역량] SARS-CoV-2 돌연변이 핫스팟 연구에서 22만 건의 유전체 데이터를 수집하고, MAFFT를 활용한 다중 서열 정렬(MSA)을 수행하였습니다. 밀도 기반 클러스터링 알고리즘을 통해 중증도와 관련된 돌연변이 핫스팟을 식별하였으며, netMHCpan을 활용한 HLA 결합 친화도 분석으로 변이가 면역 반응에 미치는 영향을 해석하였습니다. 단순히 변이를 호출하는 것을 넘어, 변이가 질병 진행에 어떤 기전으로 영향을 미치는지를 Multi-omics 관점에서 해석한 경험이 있습니다. 이 역량은 KRIBB에서 질환별 유전변이의 임상적 의미를 판단하고 통합 분석하는 업무에 활용될 수 있다고 생각합니다. [AI 모델링 및 성능관리 시스템 구축 역량] COVID-19 사이토카인 마커 발굴 연구에서 의료 데이터의 품질 문제를 체계적으로 관리한 경험이 있습니다. 191개 사이토카인 중 13,203개의 결측값이 존재하는 데이터에서 결측률 15% 미만인 166개 사이토카인만을 포함하는 엄격한 필터링 기준을 설계하고, 비선형 관계를 반영할 수 있는 MissForest로 결측값을 대치하였습니다. 60개 샘플의 소규모 데이터에서 과적합을 방지하기 위해 Random Forest를 선택하고, SHAP TreeExplainer를 활용하여 개인별 사이토카인 중증도 기여도를 분석하였습니다. SKALA 2기에서는 AI 모델의 품질을 지속적으로 관리하는 MLOps 시스템을 구축하였습니다. Layer specific learning rate 설계 및 비선형 Classifier 설계로 VERT 모델의 분류 성능을 올렸으며, MLflow로 전체 실험을 추적하는 체계를 구성하였습니다. 이러한 경험은 KRIBB에서 대규모 유전체 데이터의 품질을 자동으로 검증하고 관리하는 AI 시스템을 구축하는 데 직접 활용될 수 있다고 생각합니다. [대용량 데이터 처리 및 시스템 운영 역량] Linux 환경에서 생물정보학 분석을 수행해 왔으며, Docker를 활용하여 분석 환경을 컨테이너화한 경험이 있습니다. 22만 건의 유전체 데이터를 Selenium으로 크롤링하고 전처리하며 대규모 데이터를 다루는 경험을 쌓았습니다. SKALA에서는 PostgreSQL과 pgvector를 활용한 데이터베이스 설계, 10만 건 규모의 벤치마크 수행, asyncio.gather를 활용한 병렬 처리 최적화 등을 경험하였습니다. 데이터 규모 증가에 따른 성능 변화를 사전에 파악하고 병목을 선제적으로 대응한 경험은, KRIBB에서 국가 수준의 대규모 유전체 데이터를 효율적으로 처리하는 데 기여할 수 있다고 생각합니다. 직무에 대한 본인의 적합성(경력 및 역량 중심) [질환별 유전변이 통합 분석 직무 적합성] 저는 다양한 질환 데이터를 통합 분석하여 생물학적 기전을 규명한 경험이 있습니다. COVID-19 연구에서는 환자 444명의 EHR 데이터와 191개 사이토카인 프로파일을 연계 분석하여 질병 악화 마커를 발굴하였고, SARS-CoV-2 연구에서는 22만 건의 유전체 데이터에서 중증도 관련 돌연변이 핫스팟을 식별하였습니다. EBV 양성 위암 연구에서는 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터를 통합하여 약물 작용 기전을 규명하였습니다. 이처럼 감염병과 암이라는 서로 다른 질환 영역에서 유전체 데이터와 임상 표현형을 연결하여 분석한 경험은, KRIBB에서 질환별 유전변이를 체계적으로 통합 분석하는 업무에 직접 활용될 수 있다고 생각합니다. [AI 품질관리 직무 적합성] 저는 의료 데이터의 품질 문제를 체계적으로 관리하고, AI 모델의 성능을 지속적으로 유지하는 시스템을 구축한 경험이 있습니다. COVID-19 사이토카인 연구에서 13,203개의 결측값이 존재하는 데이터를 다루며, 결측률 15% 미만 필터링과 MissForest 대치라는 엄격한 품질관리 전략을 설계하였습니다. 이 경험을 통해 의료 데이터에서 품질 기준을 어떻게 설정하고 적용해야 하는지를 체득하였습니다. SKALA 2기에서는 이러한 품질관리 역량을 시스템 수준으로 확장하였습니다. MLflow로 전체 실험을 추적하는 MLOps 체계를 구축하여 단순히 모델을 만드는 것이 아니라 모델 품질을 지속적으로 관리하는 시스템을 설계한 경험은, KRIBB에서 유전체 데이터의 품질을 자동으로 검증하는 AI 시스템을 구축하는 데 핵심 역량이 될 수 있다고 생각합니다. [도메인 특성을 고려한 분석 설계 역량] 저의 강점은 도메인의 특성에 맞게 분석 전략을 설계하는 능력입니다. 의료 도메인에서는 오분류가 환자 안전에 직결되므로 Recall과 해석 가능성을 최우선으로 설계하였습니다. COVID-19 연구에서 60개 샘플의 소규모 데이터에서 딥러닝의 과적합이 불가피하다고 판단하여 Random Forest를 선택하고, SHAP TreeExplainer로 개인별 해석이 가능한 분석 결과를 제시하였습니다. B2B 도메인에서는 오탐이 계약 위약금으로 이어지므로 Precision과 SLA 준수를 중심으로 설계하였습니다. 동일한 AI 모델링이라도 도메인에 따라 우선순위가 달라진다는 것을 체감하였고, 그에 맞는 지표 선정, 모델 선택, 검증 방식을 설계할 수 있는 역량을 갖추게 되었습니다. 이 역량은 KRIBB에서 국가 유전체 데이터라는 공공 도메인의 특성에 맞는 품질관리 전략을 설계하는 데 활용될 수 있다고 생각합니다. [국가 기관 협업 및 다학제 소통 역량] 저는 이미 국가 기관 및 외부 연구기관과 협업하여 연구를 완수한 경험이 있습니다. 질병관리청 협업 과제에서 국립보건연구원(KNIH)의 COVID-19 코호트 데이터를 분석하였고, 경북대학교 약학대학과 협업하여 EBV 양성 위암 연구를 수행하였습니다. SKALA 2기에서는 6인 팀 프로젝트에서 GitHub 브랜치 전략과 Jira를 활용한 체계적인 협업을 경험하였고, 의견 충돌 시 객관적 기준으로 비교하여 합리적으로 조율하는 방법을 배웠습니다. 이러한 협업 경험은 KRIBB에서 원내 연구팀은 물론 외부 병원, 대학, 기업 연구자들과 소통하며 유전체 데이터 인프라를 구축하는 데 기여할 수 있다고 생각합니다. 직무와 관련된 경력/교육/기타 사례 [연구 경력] 경북대학교 Computational Biology Lab(COBI)에서 약 3년 6개월간 인턴 및 석사과정을 수행하며 3건의 연구 프로젝트에 참여하였습니다. 첫 번째로, SARS-CoV-2 유전체에서 중증도 관련 돌연변이 핫스팟을 탐지하는 클러스터링 알고리즘 연구를 수행하였습니다. Selenium을 활용하여 22만 건의 유전체 데이터를 크롤링하고 MAFFT로 다중 서열 정렬을 수행하였으며, Docker와 netMHCpan을 활용한 HLA 결합 친화도 분석, edgeR를 활용한 차등 발현 유전자 분석, 코호트 클러스터링과 ANOVA 통계 분석을 수행하였습니다. HLA, 네트워크, DEG 분석을 결합한 Multi-omics 분석 전략을 직접 설계하여 면역학적 기전을 규명하였고, 연구 방향성을 주도적으로 제안한 기여도를 인정받아 SCIE 논문(BioData Mining, IF 6.1)의 제1저자로 등재되었습니다. 두 번째로, 질병관리청 협업 과제인 COVID-19 질병 진행 모델링 연구에 참여하였습니다. 국립보건연구원(KNIH)의 COVID-19 코호트 데이터를 활용하여 환자 444명의 EHR 데이터와 191개 사이토카인 발현 프로파일을 분석하였습니다. 13,203개의 결측값이 존재하는 데이터에서 결측률 15% 미만인 166개 사이토카인만을 포함하는 엄격한 필터링을 적용하고 MissForest로 결측값을 대치하였습니다. 60개 샘플의 소규모 데이터에서 Random Forest를 선택하고 SHAP TreeExplainer로 개인별 사이토카인 중증도 기여도를 분석하여 악화 마커를 발굴하였습니다. 세 번째로, 경북대학교 약학대학과 협업하여 EBV 양성 위암 환자에서 DHT 약물의 작용 기전을 규명하는 멀티오믹스 연구를 수행하였습니다. RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터의 전처리와 분석을 전담하였습니다. FastQC, TopHat, SAMtools, HTSeq을 활용한 RNA-seq 전처리, Bismark를 활용한 BS-seq 전처리, Bowtie2와 Trimmomatic을 활용한 ChIP-seq 전처리를 수행하였고, edgeR를 활용한 DEG 분석, methylKit을 활용한 DMR 분석, IGV를 활용한 ChIP-seq 시각화를 수행하였습니다. [교육 이수] SK AX AI Leader Academy(SKALA) 2기에서 5개월간 AI 서비스 개발 교육을 이수하였습니다. 프론트엔드, 백엔드, 데이터베이스, AI 모델링, LLM 등 서비스 개발에 필요한 기술 스택을 습득하였으며, 8주간의 최종 프로젝트에서 AI 서비스의 기획부터 개발, 성능 최적화까지 전체 사이클을 경험하였습니다. 최종 프로젝트로 4개 플랫폼의 업무 데이터를 통합하여 주간업무 보고서를 자동 생성하는 B2B AI 서비스를 6인 팀으로 개발하였으며, DB 설계와 API 개발을 담당하였습니다. PostgreSQL과 pgvector로 관계형 데이터와 벡터 검색을 단일 DB에서 처리하는 구조를 설계하고, Redis 캐싱으로 반복 조회를 217ms에서 2ms로 개선, asyncio.gather 병렬 처리로 타임라인 조회를 1.56배 단축, BackgroundTasks로 리포트 P95를 178ms에서 60ms로 안정화하여 전체 엔드포인트에서 B2B SLA 기준을 충족하였습니다. 개인 프로젝트로 BERT 기반 뉴스 분류 모델을 구축하고 B2B SLA를 충족하는 서빙 및 모니터링 체계를 구축하였습니다. Null Model부터 변수를 순차 변경하며 F1을 91.46%에서 94.75%로 개선하고, M1 CPU 환경에서 ONNX 변환으로 P95 76.9ms를 달성하였습니다. Champion-Challenger 재학습 파이프라인을 구축하여 모델 성능을 지속적으로 관리하는 MLOps 체계를 구성하였습니다. 임용시 직무 수행계획 입사 초기에는 한국생명공학연구원의 유전체 데이터 분석 체계와 품질관리 프로세스를 깊이 이해하는 데 집중하겠습니다. 기존에 구축된 분석 파이프라인과 데이터베이스 구조를 파악하고, 원내 연구원들과의 소통을 통해 현재 업무의 흐름과 개선이 필요한 부분을 파악하겠습니다. 또한 GATK, DeepVariant 등 표준 변이 호출 도구를 익히고, ClinVar, gnomAD, KRGDB 등 공공 데이터베이스 활용 역량을 강화하여 질환별 유전변이 통합 분석 업무에 즉시 기여할 수 있는 기반을 마련하겠습니다. 기반 역량을 갖춘 후에는 질환별 유전변이 통합 분석 업무에 본격적으로 참여하겠습니다. 석사과정에서 COVID-19, SARS-CoV-2, EBV 양성 위암 등 서로 다른 질환 영역의 데이터를 분석하며 임상 표현형과 유전체 데이터를 연계하는 경험을 쌓았습니다. 이 경험을 바탕으로 다양한 질환군의 유전변이 데이터를 체계적으로 수집하고, 변이의 병원성을 판단하며, 임상적 의미를 해석하는 업무를 수행하겠습니다. 특히 멀티오믹스 통합 분석 역량을 활용하여 유전체 데이터만으로는 파악하기 어려운 변이의 기능적 영향을 전사체, 후성유전체 데이터와 연계하여 분석하는 데 기여하겠습니다. 유전변이 분석 업무에 숙련된 후에는 AI 기반 데이터 품질관리 시스템 구축에 기여하고 싶습니다. 구체적으로는 시퀀싱 데이터의 품질 지표를 자동으로 모니터링하고, 변이 호출 결과의 정확도를 검증하며, 배치 효과나 이상치를 탐지하는 AI 모델 개발에 기여하겠습니다. 단순히 분석 스크립트를 작성하는 것이 아니라, 지속적으로 데이터 품질을 감시하고 문제를 선제적으로 대응하는 시스템을 구축하는 데 역량을 발휘하겠습니다. cf 너무 쓰기싫어서 다 클로드 돌렸는데 다시 보니까 너무너무 티나넹.......... 좀만 일찍 쓸걸!!!!!!
2026-03-04 ⋯ 2월말 공고 (+ 3월 추가)
추가공고 24. 메디플렉서스 https://www.jobkorea.co.kr/Recruit/GI_Read/48605718?Oem_Code=C1&sc=9 - 직무: 의료 빅데이터 기반 통계 연구원 - 규모: 12명 - 주요사업: 응용 소프트웨어 개발 및 공급업 - 잡코리아 지원완료 25. 엑소시스템즈 https://www.jobkorea.co.kr/Recruit/GI_Read/48478200?Oem_Code=C1 - 마감일: 2026.02.28 - 직무: AI 엔지니어 - 규모: 14명 - 주요사업: 전기식 진단 및 요법 기기 제조업 - 홈페이지 지원 26. 엑스모 https://www.jobkorea.co.kr/Recruit/GI_Read/48595013?sc=727&sn=102 - 직무: 의료 데이터 분석 연구원 - 규모: -명 - 주요사업 - - 잡코리아 지원완료 27. 한컴케어링크 https://www.jobkorea.co.kr/Recruit/GI_Read/48518349?sc=727&sn=102 - 직무: 바이오인포매틱스 및 AI 융합 연구원 - 규모: 42명 - 주요사업: 종합건강관리,외국인환자 유치,유전자분석 알선/전자상거래 - 잡코리아 지원완료 28. 히츠 - 직무: AI Researcher - 규모: 31명 - 주요사업: 컴퓨터 프로그래밍, 시스템 통합 및 관리업 - 잡코리아 지원완료 29. 셀트리온 https://www.jobkorea.co.kr/Recruit/GI_Read/48605899?Oem_Code=C1&sc=66 - 마감일: 2026.03.15 - 직무: AI Engineering & Platforms (BI/AI 신약개발 - 타겟발굴) - 규모: 3,000명 - 주요사업: 바이오 의약품 연구, 개발 - 홈페이지 지원 30. 딥노이드 https://www.jobkorea.co.kr/Recruit/GI_Read/48625094?Oem_Code=C1&sc=7 - 마감일: 상시채용 - 직무: AI Researcher (Computational Pathology) - 규모: 188명 - 주요사업: 의료AI - 홈페이지 채용 31. 에어스메디컬 https://www.jobkorea.co.kr/Recruit/GI_Read/48545091?Oem_Code=C1&sc=7 - 마감일: 2026.03.04 - 직무: AI Research Scientist - 규모: 87명 - 주요사업: 응용 소프트웨어 개발 및 공급업 - 홈페이지 채용 32. 이지케어텍 https://www.jobkorea.co.kr/Recruit/GI_Read/48526423?Oem_Code=C1&sc=7 - 마감일: 2026.04.03 - 직무: 연구소 MLOps Engineer - 규모: 450명 - 주요사업: 의료정보시스템 개발/운영 - 잡코리아 지원완료 33. 엔티엘헬스케어 https://www.jobkorea.co.kr/Recruit/GI_Read/48621164?Oem_Code=C1&sc=7 - 마감일: 2026.03.20 - 직무: 의료영상 인공지능 모델 연구 및 개발자 - 규모: 20명 - 주요사업: 원격 자궁암 검진시스템 34. 포튜나헬릭스 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=52944665&recommend_ids=eJxVjskNAzEMA6vJXyR1vlNI%2Bu8i3gBrb54DSkOGkBaqT8Ne9Q6Zl3csxIWcBjs3luDok05x7MaVjZO3ilkjPY6rccyCMRMHkxOxf1dvc%2FfKkuH6U%2BWjt2wNOSPp%2FlPhC9StL90%3D&view_type=list&gz=1&relayNonce=4f20105ed17f4eacbfbf&search_uuid=5e312dda-90fb-47dd-9cde-3da1b98ac243&immediately_apply_layer_open=n - 마감일: 2026.02.26 - 직무: 생물정보(bioinformatics) 분석연구원 - 규모: 3명 - 사람인 지원완료 35. 로킷제노믹스 saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53112547&recommend_ids=eJxtjbkRw0AMA6txThB8YxWi%2FruwJM%2BZFyjcBUG4tgeIsyCfPFygYZYveNotKKUSfgncqN2pLYMp7FrtDVc76dFzXhXP9g8r1L0WUpSO%2FxQBltikCOa2TKcNZpZp759Dp4tL4Em%2F11Q3Zw%3D%3D&view_type=list&gz=1&relayNonce=f2506508abfc269c5ae4&search_uuid=5becebdf-4f03-4328-b25c-eb58ab72fefc&immediately_apply_layer_open=n - 마감일: 상시채용 - 직무: Bioinformatics Scientist(Single-cell Omics) - 규모: 14명 - 주요사업: 유전체 분석업 36. 아이엠비디엑스 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53145388&recommend_ids=eJxNzskVw0AIA9BqcgeEWM4uxP134djOhDl%2B0BNQ1MI9z1L55MGNp98Da4ZC1x5SJsEv9d12WsswBV0rvPEtgyQYveIQA5VDDeS%2FDKoo8aFVaM%2Bpqnj%2B%2BhGEzyOZ5TbhCiNrZ9jTfAHRxzdn&view_type=list&gz=1&relayNonce=daf0cfe9b87524068789&search_uuid=null&immediately_apply_layer_open=n - 마감일: 2026.03.25 - 직무: 생물정보학 전문가(BI) - 규모: 55명 - 주요사업: 의학,약학 연구개발 - 사람인 지원완료 37. 아이노클 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=yes&rec_idx=52726071&recommend_ids=eJxNzbkVwzAMA9Bp0gO8WWcQ779FbOdJVPl5AA5KmOVVxCe%2FfvCyZyDtQeXaSxdL4iYfKkoQvijdKY1hQrvmd%2FOfrUj16B3GvC3r%2FGXpJkSdPs0MzaOqDGYTRS0cdGTFJEsF394f1Yo3WQ%3D%3D&view_type=quick_complete&gz=1&t_ref_scnid=810&t_ref_content=SRI_050_APPLY-Q_AVA_RCT&t_ref=complete_layer&referNonce=87db44c61821f6a51309&relayNonce=f8e51773a5aa90b33d08&immediately_apply_layer_open=n - 마감일: 상시채용 - 직무: BI 분석 - 규모: 8명 - 사람인 지원완료 38. 국립암센터 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53093610&recommend_ids=eJxNjrkNwDAMA6dJL0qinjqDZP8tYsCArfJA8kAaQmj5FeTJlyaQbD0IsFgLsdMqSzuIVDW%2F5YUdV%2BUBz1FOpd20HT1VLPRQBXNgaJMXifCxlfDoaeb%2B%2FAO9xC%2B9&view_type=list&gz=1&relayNonce=4618d39547eaef0b38f2&search_uuid=a60b4233-36e1-4d2f-886f-2a198f73f68b&immediately_apply_layer_open=n - 마감일: 2026.02.26 - 직무: Medical AI 연구원 - 규모: 1,380명 - 주요사업: 병원(암 연구,진료,교육)/암관련시스템 구축 - 사람인 지원완료 39. 디엔에이케어 https://www.jobkorea.co.kr/Recruit/GI_Read/48658056?Oem_Code=C1 - 마감일: 2026.03.26 - 직무: 유전체 정보 분석(bioinformatics) 연구원 - 규모: 10명 - 주요사업: 유전자 분석 - 잡코리아 지원완료 40. 서울아산병원 https://www.jobkorea.co.kr/Recruit/GI_Read/48611730?Oem_Code=C1 - 마감일: 2026.03.19 - 직무: AI Scientist - 규모: 7,000명 - 주요사업: 의료 - 잡코리아 지원완료 41. 휴런 https://www.jobkorea.co.kr/Recruit/GI_Read/48575883?Oem_Code=C1&sc=9 - 마감일: 2026.03.11 - 직무: 영상 기반 AI 분석 연구 개발자 - 규모: 56명 - 주요사업: 소프트웨어 개발 42. 뉴로클 https://www.jobkorea.co.kr/Recruit/GI_Read/48607648?Oem_Code=C1&sc=9 - 마감일: 2026.02.27 - 직무: AI 딥러닝 리서치 연구원 - 잡코리아 지원완료 43. 연세대학교 의료원 https://www.saramin.co.kr/zf_user/jobs/relay/view?rec_idx=53202018&search_uuid=e15afb34-2e2c-4ec3-b7bd-8d8639693d7b&view_type=list - 마감일: 2026.03.29 23:59 - 직무: Bioinformatics 연구원 44. 국립암센터 https://www.saramin.co.kr/zf_user/jobs/relay/view?rec_idx=53157425&search_uuid=b638a7cc-c9ee-4dfc-8cf3-c286b2823819&view_type=list - 직무: 암빅데이터센터 생물정보학연구원 - 규모: 2,932명 - 사람인 지원완료 45. 한국생명공학연구원 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53150539&recommend_ids=eJxdz8sJw2AMA%2BBperfkp84dJPtv0Z9AYujxQ5aN01GW3tfAPv1NN2ukHlKEJg55p0QYcIg%2FXnGPtxSsJ%2BfAI7m7FZC%2FPG36LgPDIt4UnlVYdg60HLG0XRzZpgH27N2i8X7xBwunM00%3D&view_type=list&gz=1&relayNonce=14d26717646d16b65665&search_uuid=53f8ca9e-b329-4b3d-9dec-25a4a1a6d0a9&immediately_apply_layer_open=n - 직무: 아직 못고름.. - 마감일: 2026.03.10 18:00 46. 국립암센터 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53007159&recommend_ids=eJw1zdENwEAIAtCVBNHTabpIh69N658vQAw20aWrwDuckAEDXLqDp1vMl4OCKziwKVoL7T9mRcdXc1Am%2FQk8MrE4UehFNbN3g7ltE4Gn9k%2FSeF48Z%2BwoFg%3D%3D&view_type=list&rec_scn_id=810&referPage=y&refDpId=SRI_050_VIEW_MTRX_RCT&gz=1&t_ref_scnid=810&refer=y&inner_source=saramin&inner_medium=pattern&inner_campaign=relay_view_0&inner_term=list&referNonce=14d26717646d16b65665&relayNonce=14d26717646d16b65665&dpId=SRI_050_VIEW_MTRX_RCT&immediately_apply_layer_open=n - 직무: '국가암기반모델' 개발 연구원 - 사람인 지원완료 47. 한양대학교디지털헬스케어센터 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53110089&recommend_ids=eJxNjckRwzAMA6vJn4B44e1C3H8XkZORpefOgtwYkDLibvBTVwyamDnR%2Fogxoibih7ApsZAlOXPdUmpZ7nFFQ%2B8reJn5G5qd4jlOszzGdO9t2RK2BVO28Ol240TxCdkX0Ysv4g%3D%3D&view_type=list&gz=1&relayNonce=a9643561d611aa7fd1c3&search_uuid=null&immediately_apply_layer_open=n - 직무: 아직 못고름.. - 마감일: 2026.03.21 23:59 48. 분당서울대학교병원 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53199655&recommend_ids=eJxFzMENwDAIQ9GVsAkBT9NFOnyJkrbHp285nCbOeRV4hxPukQ00YB2wwZQGz4xSyeY7yyioYY0%2BS36FJeEUgFO2sQ6q8EMcCw9dIyGn&view_type=list&rec_scn_id=811&referPage=y&refDpId=SRI_050_VIEW_MTRX_RCT&gz=1&t_ref_scnid=811&refer=y&inner_source=saramin&inner_medium=pattern&inner_campaign=relay_view_0&inner_term=list&referNonce=ed54a12a75887a7e5547&relayNonce=ed54a12a75887a7e5547&dpId=SRI_050_VIEW_MTRX_RCT&immediately_apply_layer_open=n - 직무: 빅데이터센터 연구원 - 마감일: 채용시 마감 49. 얼전트 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53115858&recommend_ids=eJxNzbsNwEAIA9Bp0mOOn%2BsMkv23CDopR8on2%2BALRQ0%2BBVx5%2BwJa0pRNlU5jiLU8pywd4qMmaRqHZFXhbJFe4NBSxA77T862yyESv7Ka1aRa5FwWSytv6veXui%2B%2Fycwv0w%3D%3D&view_type=list&gz=1&relayNonce=0600afdc4a32429e39e3&search_uuid=null&immediately_apply_layer_open=n - 직무: 의료영상 AI/Ontology 연구원 - 마감일: 2026.03.22 50. 엘지경영개발원 https://www.saramin.co.kr/zf_user/jobs/relay/view?isMypage=no&rec_idx=53195665&recommend_ids=eJxNzskVw0AIA9Bqckcym84uxP13ESdehuNHT0BsrE2yo4FP7TF4%2BDXwkPPJWTqVJ3mlJuYipIxYrGjoIRXZ8xSr1C9BIUeXLeHtNoH%2FG3cK5lhlXt6jayHaopeZ%2F%2FgFU%2BIzsg%3D%3D&view_type=list&gz=1&relayNonce=a8fde644ed791dbe3a01&search_uuid=2996b921-a22b-4cf0-b162-5599077a4e2f&immediately_apply_layer_open=n - 직무: Protein Design Research Engineer Internship - 마감일: 2026.03.15 - 홈페이지 지원완료 51. 제이엘케이 https://www.jobkorea.co.kr/Recruit/GI_Read/48628844?Oem_Code=C1 - 직무: 인공지능(AI) 빅데이터 연구원 - 잡코리아 지원완료 52. 유한양행 https://www.jobkorea.co.kr/Recruit/GI_Read/48733098?Oem_Code=C1 - 직무: 중앙연구소 > New Modality - 마감일: 2026.03.22 오전 10시 지원완료 - 메디젠휴먼케어 - 뷰노 (홈페이지) -> 서류탈락 - 에비드넷 (홈페이지) - 딥마인 - 케어네이션 - 온택트헬스 - 블록스퀘어랩스 - 제이시스메디칼 - 애이마 - 메디플렉서스 - 엑스모 -> 서류합격 - 한컴케어링크 -> 서류합격 -> 1차탈락 - 히츠 -> 서류탈락 - 딥노이드 (홈페이지) -> 서류탈락 - 에어스메디컬 (홈페이지) -> 서류탈락 - 이지케어텍 - 엑소시스템즈 - 포튜나헬릭스 - 아이엠비디엑스 - 아이노클 - 국립암센터 (Medical AI 연구원) - 디엔에이케어 - 뉴로클 -> 서류합격 - AMC사이언스 - 국립암센터 (암빅데이터센터 생물정보학연구원) -> 서류합격 - 국립암센터 ('국가암기반모델' 개발 연구원) 지원예정 - 엑소시스템즈 (02.28) -> 지원완료 - AMC사이언스 (02.28 15시 00분) -> 지원완료 - 한국생명공학연구원 (03.10 18:00) -> 지원완료 - 휴런 (03.11) - 셀트리온 (03.15) -> 작성중 - 엘지경영개발원 (03.15) -> 지원완료 - 서울아산병원 (03.19) - 엔티엘헬스케어 (03.20) - 한양대학교디지털헬스케어센터 (03.21) - 유한양행 (03.22 오전 10시) -> 작성중 - 얼전트 (03.22 23:00) - 연세대학교 의료원 (03.29) - 뉴엔에이아이 (04.11) - 셀타스퀘어 (04.12) - 삼양식품 (04.24) - 로킷제노믹스 (상시채용) - 분당서울대학교병원 (상시채용) 삼양식품 오믹스 bioinformatics가 있고 ai engineer가 있다 - 오믹스 bioinformatics: https://www.jobkorea.co.kr/Recruit/GI_Read/48647279?Oem_Code=C1&sc=7 - 오믹스 ai engineer: https://www.jobkorea.co.kr/Recruit/GI_Read/48647337?Oem_Code=C1&sc=7 amc사이언스도 오믹스 분석이 있고 ai기반 신약개발이 있는데 .. 오믹스가 낫겠지?? 의료영상 기업 - 에어스메디컬 https://www.jobkorea.co.kr/Recruit/GI_Read/48544805?Oem_Code=C1 - 엔티엘헬스케어 https://www.jobkorea.co.kr/Recruit/GI_Read/48621164?Oem_Code=C1 - 휴런 https://www.jobkorea.co.kr/Recruit/GI_Read/48575883?Oem_Code=C1&sc=9 - 뉴로클 https://www.jobkorea.co.kr/Recruit/GI_Read/48607648?Oem_Code=C1&sc=9
2026-02-27 ⋯ 기업 순위 정리
순위판단기준: 매출액 > 직원수 > 시가총액/기업가치 > 모그룹 소속 > 상장여부 대기업/중견기업 1. 셀트리온 - 매출액: ~3조 5,573억 (2024, 연결) - 직원수: 3,000명 - 시가총액: 약 30조+ - 직무: AI Engineering & Platforms (BI/AI 신약개발 - 타겟발굴) - 비고: 대기업. 코스피 상장. 바이오시밀러 글로벌 1위권. 램시마·짐펜트라 등 11개 제품 포트폴리오 2. 삼양식품 - 매출액: ~1조 7,280억 (2024, 연결) - 직원수: 2,880명 - 시가총액: 약 8~10조 - 직무: OMICS Bioinformatics 연구원 - 비고: 중견기업. 코스피 상장. 불닭볶음면 글로벌 히트. 영업이익률 20%+. 수출비중 77% 코스닥 상장 중소기업 (매출 ~수백억) 3. 제이시스메디칼 - 매출액: ~1,430억 (2023) - 직원수: 322명 - 시가총액: 약 9,764억 - 직무: 의료기기 Medical Publication 학술연구 - 비고: 코스닥 상장. 피부미용 의료기기(포텐자, 덴서티). 해외매출 80%+. 프랑스 PEF 아키메드 인수 진행중 4. 이지케어텍 - 매출액: ~726억 (2024.3-2025.3) - 직원수: 450명 - 시가총액: 약 1,000억대 - 직무: 연구소 MLOps Engineer - 비고: 코스닥 상장. 병원정보시스템(HIS) 전문. 서울대병원 등 대형병원 60곳+ 납품. 사우디 수출 5. 뷰노 - 매출액: ~302억 (2024 추정) - 직원수: 155명 - 시가총액: 약 3,576억 - 직무: Clinical Researcher - 비고: 코스닥 상장. 의료AI 선도. 딥카스(심정지 예측) 국내 최초 의료기술 인정. FDA·CE MDR 승인 6. 딥노이드 - 매출액: ~110억 (2024 추정) - 직원수: 188명 - 시가총액: 수백억대 - 직무: AI Researcher (Computational Pathology) - 비고: 코스닥 상장. 의료AI + 보안AI + 제조검사 AI. 매출 YoY 458% 성장 공공기관/병원 7. 서울아산병원 - 매출액: ~3조 1,505억 (2023, 아산사회복지재단 사업수입 기준) - 직원수: 7,000명+ - 시가총액: 해당없음 (아산사회복지재단 산하, 비영리 재단법인) - 직무: AI Scientist - 비고: 국내 최대 상급종합병원. 2,432병상. 뉴스위크 세계병원순위 최상위권. HD현대그룹 정몽준 이사장 운영. 아산생명과학연구소·임상연구센터 보유. 8. 국립암센터 - 매출액: 해당없음 (국가 의료기관) - 직원수: 1,380명 - 시가총액: 해당없음 (보건복지부 산하 공공기관) - 직무: Medical AI 연구원 - 비고: 국가암관리 총괄. 연구·진료·교육. 기업 순위 비교 부적합하나, 안정성·복지·연구환경은 최상위급 대기업 그룹 계열 신설법인 9. AMC사이언스 - 매출액: 초기 (2024.11 설립) - 직원수: 50명 - 시가총액: 비상장 (HD한국조선해양 100% 자회사) - 직무: 오믹스분석 - 비고: HD현대그룹(재계 8위) 계열. 서울아산병원 연계 신약개발(ADC 항체 등). 2025년 본격 R&D 돌입. 대규모 공채 진행 10. 한컴케어링크 - 매출액: ~40~100억 추정 (매출 200억 목표 2025) - 직원수: 42명 - 시가총액: 비상장 (한컴그룹 계열사) - 직무: 바이오인포매틱스 및 AI 융합 연구원 - 비고: 디지털 헬스케어 플랫폼. 유전체분석, 맞춤형 건강검진 서비스. 한컴그룹 자금력 보유 상장 소형주 + 투자유치 스타트업 (매출 수십억) 11. 에어스메디컬 - 매출액: ~41억 (2024) - 직원수: 87명 - 시가총액: 비상장 (누적투자 573억, 예비유니콘) - 직무: AI Research Scientist - 비고: MRI AI 솔루션(스위프트MR). 20개국 500개 기관 도입. 시리즈D 진행중. FDA 승인. ARR 절반 이상 해외 12. 메디젠휴먼케어 - 매출액: ~46억 (2023) - 직원수: 34명 - 시가총액: 코넥스 상장 (누적투자 168억) - 직무: Bioinformatics 알고리즘 개발 및 데이터 분석가 - 비고: 유전체 분석 전문. 누적 검사 150만건. 인도네시아·말레이시아 등 해외 JV 다수 13. 아이엠비디엑스 - 매출액: ~34억 (2024) - 직원수: 55명 - 시가총액: 코스닥 상장 (2024 상장) - 직무: 생물정보학 전문가(BI) - 비고: 액체생검(AlphaLiquid). 대학병원 다수 납품. 대만·태국 수출. 2026년 매출 100억·흑자 목표 14. 휴런 - 매출액: 초기 매출 단계 - 직원수: 56명 - 직무: 영상 기반 AI 분석 연구 개발자 - 비고: 뇌질환 AI 전문(파킨슨·뇌졸중 진단). FDA 승인. 지멘스 헬시니어스 협약. 싱가포르 법인 설립 15. 뉴로클 - 매출액: 수십억 추정 - 직원수: ~32명 - 직무: AI 딥러닝 리서치 연구원 - 비고: 딥러닝 비전 SW(뉴로티, 뉴로알). 25개국 진출. 삼성·현대차·서울대병원 납품 초기 스타트업 (공개 재무정보 제한) 16. 뉴엔에이아이 - 직무: 소셜 빅데이터 분석 컨설턴트(데이터 사이언티스트) - 직원수: 200명 - 비고: AI 기반 신약개발 플랫폼 17. 케어네이션 - 직무: 데이터 분석가 - 규모: 80명 - 비고: 돌봄·간병 매칭 플랫폼 18. 에비드넷 - 직무: 의료 데이터사이언티스트 - 직원수: 62명 - 비고: 의료 데이터·근거기반 의학 플랫폼 19. 온택트헬스 - 직무: 의료데이터 분석가 - 직원수: 49명 - 비고: 비대면 헬스케어 20. 블록스퀘어랩스 - 매출액: 비공개 - 직원수: 40명 - 비고: 블록체인·헬스케어 21. 셀타스퀘어 - 직무: PV Specialist - 직원수: 37명 - 비고: 세포·유전자 치료제 CDMO. 차세대 바이오 위탁생산 22. 히츠 - 직무: AI Researcher - 규모: 31명 - 비고: AI 신약개발 23. 엔티엘헬스케어 - 직무: 의료영상 인공지능 모델 연구 및 개발자 - 직원수: 20명 - 비고: 헬스케어. 공개정보 제한적 24. 로킷제노믹스 - 직무: Bioinformatics Scientist(Single-cell Omics) - 직원수: 14명 - 비고: 유전체 분석, 3D바이오프린팅. 로킷헬스케어 계열 25. 엑소시스템즈 - 직무: 디지털헬스케어 AI엔지니어 - 규모: 14명 - 비고: 웨어러블 로봇·재활기기 26. 메디플렉서스 - 직무: 의료 빅데이터 기반 통계 연구원 - 규모: 12명 - 비고: 의료기기·헬스케어 27. 디엔에이케어 - 직무: 유전체 정보 분석(bioinformatics) 연구원 - 직원수: 10명 - 비고: 유전자검사 서비스 28. 애이마 - 직무: Bioinformatics 연구원 - 규모: 10명 - 비고: AI / 의료 29. 아이노클 - 직무: BI 분석 - 규모: 8명 - 비고: AI / 의료 30. 딥마인 - 직무: 데이터 분석, 수요예측 분석 - 규모: 5명 - 비고: AI / 딥러닝 31. 포튜나헬릭스 - 직무: 생물정보(bioinformatics) 분석연구원 - 직원수: 3명 - 비고: 유전체·정밀의료 32. 엑스모 - 직무: 의료 데이터 분석 연구원 - 비고: 의료·기술
2026-02-26 ⋯ 기업분석 #5 셀트리온
1. 희망 직무를 수행하기 위해 준비한 것과 직무와 관련된 본인 역량 BI/AI 신약개발의 타겟발굴 직무는 신약 개발 파이프라인에서 타겟 선택의 과학적 근거를 멀티오믹스 분석 및 AI로 제공하는 직무입니다. 신약 타겟 발굴의 속도와 신뢰도를 높이는 이 직무에서, 해당 직무를 수행하기 위해 이 두 가지 핵심역량을 키웠습니다. 첫째, 멀티오믹스 데이터에서 생물학적 인과관계를 규명하는 분석 역량입니다. 저는 EBV 양성 위암 연구에서 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스를 직접 전처리하고 통합 분석하여, DHT 약물이 면역 반응을 유도하는 인과 경로를 규명했습니다. 또한 COVID-19 연구에서는 60개 소규모 샘플에서 과적합을 회피하기 위해 딥러닝 대신 Random Forest를 선택한 뒤 SHAP으로 중증도 기여도를 분해했습니다. 이 두 연구를 통해 개별 오믹스의 결과를 나열하는 것이 아닌, 교차 검증을 통해 하나의 인과 경로로 수렴시키는 통합 분석 역량과 도메인에 적합한 모델을 선택하는 설계 판단력을 갖추었습니다. 둘째, 연구의 목적에 맞는 분석을 설계하고 그 결과를 의사결정에 연결하는 능력입니다. 저는 Mutclust 연구에서 전달받은 알고리즘 결과를 수동적으로 해석하지 않고, 이 알고리즘의 차별점이 무엇인지를 스스로 정의한 뒤 그것을 입증하기 위한 HLA 결합 친화도 분석을 설계하여 면역학적 기전을 규명했습니다. 분석의 방향을 연구 목적에서 역산하여 설계하고, 그 결과를 타겟의 면역학적 공략 가능성이라는 판단 근거로 제시한 이 경험은, 타겟 발굴 결과를 파이프라인 진행 여부의 판단 근거로 전달하는 기여할 수 있다고 생각합니다.
2026-02-25 ⋯ 기업분석 #4 AMC사이언스
1. 본인의 회사 선택 기준은 무엇이며, HD현대가 어떤 측면에서 그 기준에 적합하다고 생각하십니까? (최대 2,000자 입력가능) 저의 회사 선택 기준은 두 가지입니다. 첫째, 제가 보유한 멀티오믹스 분석 역량과 엔지니어링 역량이 회사의 핵심 사업에 직접 기여할 수 있는 구조인지, 둘째, 그 사업이 장기적으로 성장할 수 있는 차별화된 경쟁우위를 갖추고 있는지입니다. 첫 번째 기준에서, AMC사이언스의 오믹스 분석 직무는 제 경험이 가장 직접적으로 기여할 수 있는 자리라고 생각합니다. 저는 석사과정에서 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터를 하나의 프로젝트 안에서 전처리부터 통합 분석까지 수행하며 멀티오믹스 분석의 전체 사이클을 경험하였고, 질병관리청 협업 과제에서는 444명 환자의 임상 데이터와 사이토카인 프로파일을 분석하며 의료 데이터의 특성에 맞는 분석 설계를 수행하였습니다. AMC사이언스의 ProteoXplore 플랫폼은 환자의 유전체, 전사체, 단백체 데이터를 통합 분석하여 신약 타깃을 발굴하는 것이 핵심이며, 이는 제가 수행해 온 멀티오믹스 통합 분석 및 바이오마커 발굴 경험이 기여할 수 있다고 생각합니다. 또한 SKALA에서 습득한 데이터베이스 설계와 백엔드 개발 역량은 분석 파이프라인을 일회성 스크립트가 아닌 재현 가능하고 확장 가능한 시스템으로 구축하는 데 기여할 수 있습니다. 신약 개발 분석 인프라를 설계해야 하는 상황에서, 오믹스 분석과 시스템 구축을 동시에 수행할 수 있는 역량은 차별화된 기여가 될 수 있다고 생각합니다. 두 번째 기준에서, AMC사이언스는 다른 대기업 계열 바이오 회사들과 명확히 차별화된 경쟁우위를 갖추고 있다고 생각합니다. 타 대기업 계열 바이오 회사들과 달리 AMC사이언스는 서울아산병원이라는 국내 최대 규모 의료기관의 방대한 환자유래샘플과 임상 데이터를 직접 활용하여 신약 타깃을 발굴하는 병원 기반 신약개발이라는 고유한 포지셔닝을 갖고 있습니다. 일반 바이오 기업이 접근할 수 없는 환자 조직과 임상 정보를 기반으로 프로테오믹스와 멀티오믹스 기술을 활용해 타깃을 발굴하는 구조는, 데이터의 양과 질 모두에서 차별성을 갖는다고 생각합니다. 여기에 HD현대그룹의 안정적 자본력이 뒷받침되어, 신약 개발이라는 장기 투자가 필요한 사업을 지속적으로 추진할 수 있는 재무적 기반까지 갖추고 있기에 AMC사이언스가 차별화된 경쟁우위를 갖추고 있다고 생각합니다. 제 멀티오믹스 분석 역량과 시스템 구축 역량을 바탕으로, 연구부문 생물정보학의 오믹스 분석 직무로 함께하며 AMC사이언스의 신약 타깃 발굴에 기여하고 싶습니다. 2. 본인이 희망하는 직무는 무엇이며, 해당 직무에 요구되는 핵심역량은 무엇이라고 생각하십니까? 그리고 이를 갖추기 위해 어떤 노력을 하셨나요? (최대 2,000자 입력가능) 저는 연구부문 생물정보학의 오믹스 분석 직무를 희망합니다. AMC사이언스의 핵심 기술은 서울아산병원의 환자 멀티오믹스 데이터를 통합 분석하여 신약 타깃을 발굴하는 ProteoXplore 플랫폼입니다. 신약 타깃 발굴 플랫폼의 분석을 수행하고 고도화하는 오믹스 분석 직무에서, 두 가지 핵심역량이 요구된다고 생각합니다. 첫째, 신약 타깃 발굴에서는 분석 결과를 단순히 나열하는 것이 아니라, 연구의 목적과 사업적 의사결정에 맞게 우선순위화하고 그 근거를 전달할 수 있는 해석 역량이 중요하다고 생각합니다. 이를 갖추기 위해, 석사과정에서 분석의 목적에 맞게 downstream 분석 체계를 설계하는 경험을 쌓았습니다. SARS-CoV-2 돌연변이 핫스팟 탐지 연구에서 알고리즘이 발굴한 477개 핫스팟을 분석할 때, 과학적 유의성만으로 나열하는 대신 "이 중에서 실제로 중증 예후와 연결될 가능성이 높은 것은 무엇인가"를 중점으로 두었습니다. HLA 결합 친화도 분석으로 면역 회피 가능성이 높은 핫스팟을 선별하고, 차등 발현 유전자 분석과 코호트 통계 분석을 결합하여 면역학적 기전을 규명함으로써 핫스팟 간 우선순위를 도출하였습니다. 성능 평가에서도 일반적인 클러스터링 지표를 그대로 채택하기보다, 해당 알고리즘의 차별점이 결과 도출에 얼마나 기여했는지를 기준으로 평가 방식을 직접 설계하였습니다. 이처럼 분석의 목적에 맞게 downstream 분석과 평가 체계를 설계한 기여도를 인정받아, 해당 논문의 유일한 석사과정 저자로서 SCI 논문의 제1저자로 등재될 수 있었습니다. 둘째, 신약 타깃 발굴 초기 단계에서는 데이터가 불완전하고 분석 방법론도 확정되지 않은 상태에서 가설을 세우고, 빠르게 검증하고, 결과에 따라 방향을 수정하는 반복적 실행 역량이 필요하다고 생각합니다. 이를 갖추기 위해, 불확실한 조건에서 반복적으로 검증하며 최적의 분석 전략을 도출하는 경험을 쌓았습니다. 질병관리청 협력 과제에서 COVID-19 환자 444명의 191개 사이토카인 프로파일을 분석할 때, 13,203개의 결측값이 존재하여 최적의 전처리 전략을 사전에 확정할 수 없는 상황이었습니다. 이에 결측률 기준을 10%, 15%, 20%로 변경하며 필터링 범위에 따른 분석 결과의 변화를 비교하여 15%라는 기준을 확정하였고, 모델 선택에서도 60개 샘플이라는 제약 하에서 반복적 검증을 수행하였습니다. 딥러닝은 학습 데이터 부족으로 validation loss가 수렴하지 않아 제외하였고, SVM은 커널과 하이퍼파라미터 조합에 따른 성능 변동이 커서 소규모 데이터에서의 안정성이 부족하다고 판단하였습니다. 최종적으로 앙상블 기반으로 분산이 낮고 SHAP과 직접 호환되어 피쳐별 해석이 가능한 Random Forest를 선택하였습니다. 또한 백엔드 엔지니어로 참여했던 SKALA 교육과정의 B2B AI 서비스 프로젝트에서, B2B SLA 기준을 충족시키기 위해서 API 성능을 향상시켜야 했습니다. API 성능을 진단할 수 있는 백엔드 엔지니어가 없었고, 실데이터가 60건으로 B2B 서비스를 테스트하기에 적은 데이터 크기였습니다. 이때 초기 상태의 성능을 먼저 측정한 뒤, 병목별로 개선 방안 항목들과 예상 효과를 정의하고 각 항목의 조합을 적용하여 Before/After를 정량적으로 비교하였습니다. 이를 통해 Redis 캐싱으로 반복 조회 응답을 217ms에서 2ms로 개선하고, asyncio.gather로 타임라인 쿼리를 31.2ms에서 19.0ms로 단축하였으며, 60건 실데이터와 10만건 더미 데이터 두 규모에서 벤치마크를 수행하였습니다. 이를 통해 부족한 데이터와 분석 방법론의 부재 상황에서, 실제 운영 시 발생할 수 있는 병목을 선제적으로 대응할 수 있었습니다. 정해진 정답이 없는 오믹스 분석에서 연구 목적에 맞게 해석의 초점을 설계하고, 불완전한 환경에서도 빠르게 실행하며 파이프라인을 고도화해 나가는 역량을 바탕으로, AMC사이언스에서 환자 멀티오믹스 데이터로부터 신약 타깃을 발굴하고 분석 체계를 구축하는 데 기여하고 싶습니다. 3. 본인의 주요 경력에 대해 기술해 주십시오. (최대 2,000자 입력가능) Bioinformatics Lab COBI에서 3건의 생물정보학 분석 연구에 참여하였으며, SKALA 2기에서 2건의 프로젝트의 DB/백엔드 개발 및 NLP AIOps 모델링을 수행했습니다. [바이러스 유전체의 돌연변이 핫스팟 탐지 알고리즘 연구] SARS-CoV-2 유전체에서 중증도와 관련된 돌연변이 핫스팟을 탐지하는 클러스터링 알고리즘을 개발하는 연구로, Selenium을 활용한 22만 건의 유전체 데이터 크롤링 및 MSA 전처리, 코호트 클러스터링과 ANOVA 통계 분석, Docker와 netMHCpan을 활용한 HLA 결합 친화도 분석, edgeR를 활용한 차등 발현 유전자 분석 등을 수행하였습니다. HLA, Network, DEG 분석을 결합한 Multi-omics 분석을 설계하여 면역학적 기전을 밝혀냈으며, 연구 방향성과 알고리즘의 강점을 고민하고 그에 맞는 Downstream 분석 및 Performance Evaluation을 설계한 점을 인정받아 SCIE 논문(BioData Mining, IF 6.1)의 제1저자로 등재되었습니다. [COVID-19 질병 진행 모델링을 통한 사이토카인 마커 발굴 연구] 질병관리청 협업 과제로, COVID-19 환자 444명의 EHR 데이터와 191개 사이토카인 프로파일을 분석하여 악화 사이토카인 마커를 발굴하였습니다. 결측값 15% 미만인 166개 사이토카인만을 포함하는 필터링을 적용하고 MissForest로 결측값을 대치하였습니다. 60개 샘플의 소규모 데이터에서 과적합을 방지하기 위해 Random Forest를 선택하고, SHAP TreeExplainer로 개인별 사이토카인 중증도 기여도를 분석하였습니다. SCIE 논문(Scientific Reports, IF 3.9)으로 출판되었으며 제2저자로 참여하였습니다. [EBV 양성 위암 환자 DHT 약물 기전 규명 멀티오믹스 연구] 경북대 약학대학과 협업하여 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터의 전처리와 분석을 전담하였습니다. TopHat/HTSeq을 활용한 RNA-seq, Bismark을 활용한 BS-seq, Bowtie2/Trimmomatic을 활용한 ChIP-seq 전처리를 수행하고, edgeR DEG 분석, methylKit DMR 분석, IGV ChIP-seq 시각화를 수행하였습니다. SCIE 논문 2편(Gastric Cancer IF 5.1, Cancers IF 4.4)으로 출판되었으며 공동저자로 참여하였습니다. [업무 보고서 자동화 AI 서비스 개발] SKALA 2기 최종 프로젝트로, 4개 플랫폼의 업무 데이터를 통합하여 주간업무 보고서를 자동 생성하는 B2B AI 서비스를 6인 팀으로 개발하였으며, DB 설계와 API 개발을 담당하였습니다. PostgreSQL과 pgvector로 관계형 데이터와 벡터 검색을 단일 DB에서 처리하는 구조를 설계하고, Redis 캐싱으로 반복 조회를 217ms에서 2ms로 개선, asyncio.gather 병렬 처리로 타임라인 조회를 1.56배 단축, BackgroundTasks로 리포트 P95를 178ms에서 60ms로 안정화하여 전체 엔드포인트에서 B2B SLA 기준을 충족하였습니다. [BERT 기반 뉴스 분류 모델 구축 및 서빙] SKALA 2기 개인 프로젝트로, BERT 기반 분류 모델을 학습하고 B2B SLA를 충족하는 서빙 및 모니터링 체계를 구축하였습니다. Null Model부터 변수를 순차 변경하며 F1을 91.46%에서 94.75%로 개선하고, B2B 도메인 특성을 고려하여 Precision 우선 의사결정을 도입해 오분류 비율을 5.26%로 낮추었습니다. M1 CPU 환경에서 ONNX 변환으로 P95 76.9ms를 달성하고, PSI 기반 드리프트 모니터링과 Champion-Challenger 재학습 파이프라인을 구축하여 MLOps 체계를 구성하였습니다. 0. 경력기술서 경북대학교 Computational Biology Lab COBI에서 약 3년 6개월간 인턴 및 석사과정을 수행하며, 바이러스 유전체 분석과 의료 데이터 기반 AI 모델링을 중심으로 3건의 연구 프로젝트에 참여하였습니다. 각 프로젝트에서 생물정보학 분석과 AI 모델링을 담당하였으며, 그 결과 SCI 논문 4편에 기여하였습니다. [바이러스 유전체의 돌연변이 핫스팟 탐지 알고리즘 연구] SARS-CoV-2 유전체에서 중증도와 관련된 돌연변이 핫스팟을 탐지하는 클러스터링 알고리즘을 개발하는 연구로, Selenium을 활용한 22만 건의 유전체 데이터 크롤링 및 MSA 전처리, 코호트 클러스터링 분석과 ANOVA 통계 분석, Docker와 netMHCpan을 활용한 HLA 결합 친화도 분석, edgeR를 활용한 차등 발현 유전자 분석 등을 수행하였습니다. HLA 분석, Network 분석, DEG 분석을 결합한 Multi-omics 분석을 설계하여 면역학적 기전을 밝혀냈으며, 연구의 방향성과 알고리즘의 강점을 고민하고 그에 맞는 Downstream 분석 및 Performance Evaluation을 설계한 점을 인정받아 SCIE 논문(BioData Mining, IF 6.1)의 제1저자로 등재되었습니다. 해당 연구는 제20회 한국유전체학회 동계심포지엄(KOGO)에서 포스터 발표를 진행하였습니다. [COVID-19 질병 진행 모델링을 통한 사이토카인 마커 발굴 연구] 질병관리청 협업 과제로, COVID-19 환자 444명의 EHR 데이터와 191개 사이토카인 발현 프로파일을 분석하여 악화 사이토카인 마커를 발굴하였습니다. 의료 데이터의 높은 결측률 문제를 해결하기 위해 결측값 15% 미만인 166개 사이토카인만을 포함하는 엄격한 필터링을 적용하고, 비선형 관계를 반영할 수 있는 MissForest로 결측값을 대치하였습니다. 학습 데이터가 60개 샘플에 불과하여 딥러닝의 과적합이 불가피하다고 판단하여 소규모 데이터에서 안정적인 Random Forest를 선택하였고, SHAP TreeExplainer를 활용하여 개인별 사이토카인 중증도 기여도를 분석하였습니다. 이 연구는 SCIE 논문(Scientific Reports, IF 3.9)으로 출판되었으며 제2저자로 참여하였습니다. [EBV 양성 위암 환자에서 DHT 약물의 작용 기전 규명 멀티오믹스 연구] 경북대학교 약학대학과 협업하여 RNA-seq, BS-seq, ChIP-seq 세 가지 오믹스 데이터의 전처리와 분석을 전담하였습니다. FastQC, TopHat, SAMtools, HTSeq을 활용한 RNA-seq 전처리, Bismark을 활용한 BS-seq 전처리, Bowtie2와 Trimmomatic을 활용한 ChIP-seq 전처리를 수행하였고, edgeR를 활용한 DEG 분석, methylKit을 활용한 DMR 분석, IGV를 활용한 ChIP-seq 시각화를 수행하였습니다. 이 연구는 SCIE 논문 2편(Gastric Cancer IF 5.1, Cancers IF 4.4)으로 출판되었으며 공동저자로 참여하였습니다. 이상의 경험을 통해 멀티오믹스 데이터 분석, 의료 도메인에 적합한 AI 모델링 설계, 그리고 연구 방향성을 주도적으로 제안하고 성과를 창출하는 역량을 갖추게 되었습니다.
2026-02-25 ⋯ 기업분석 #3 엑소시스템즈
엑소시스템즈에서 희망하시는 역할과 지원자님이 기대하시는 바가 궁금합니다. 엑소시스템즈에서 생체신호 기반의 디지털 바이오마커 분석 알고리즘 개발 및 사용자 데이터 기반의 Key Index 설계 업무를 희망하고 있습니다. Random Forest와 SHAP을 활용해 COVID-19 질병 악화 사이토카인 마커를 발굴하고, 개인별 해석이 가능한 분석 결과를 제시한 경험은 엑소시스템즈의 MFI와 같은 디지털 바이오마커를 고도화하고 새로운 질환 영역에 확장하는 업무에 기여할 수 있을 것으로 생각합니다. 또한 Mutclust 연구에서 돌연변이 핫스팟 탐지 알고리즘의 downstream 분석 및 performance evaluation을 직접 설계하고 SCIE 논문 1저자로 성과를 낸 경험은, 임상시험에서 사용할 핵심 지표를 정의하고 검증 체계를 설계하는 업무에 기여할 수 있을 것으로 생각합니다. 또한 PyTorch, BERT, MLflow를 기반으로 한 모델 학습 및 실험 관리 경험은, 생체신호 분석 알고리즘의 체계적인 개발 프로세스를 구축하고 모델 성능을 지속적으로 개선해 나가는 데 기여할 수 있다고 생각합니다. 저는 엑소시스템즈에서 단순히 주어진 데이터를 분석하는 역할에 머무르지 않고, 연구의 방향성을 주도적으로 설계하며 성장하고 싶습니다. Mutclust 연구의 유일한 석사과정 저자로써 박사과정 연구원들보다 높은 기여도를 인정받을 수 있었던 것은, 전달받은 결과를 해석하는 데 그치지 않고 연구 전체의 방향성과 알고리즘의 selling point를 고민하여 분석을 설계했기 때문이라고 생각합니다. 이러한 경험을 바탕으로, 엑소시스템즈에서도 디지털 바이오마커 기술의 연구 로드맵을 함께 설계하고, 근골격계를 넘어 다양한 만성질환으로의 적응증 확대 전략을 기술적 관점에서 제안하며, 나아가 AI 팀의 연구 방향을 포괄적인 시각에서 이끌어가는 역할까지 담당하고 싶습니다.
2026-02-13 ⋯ 2월공고
공고정리 1. 에비드넷 https://www.jobkorea.co.kr/Recruit/GI_Read/48465409?Oem_Code=C1&sc=7 - 마감일: 2026.03.23 - 직무: 의료 데이터사이언티스트 - 규모: 62명 - 홈페이지 지원완료 - 24일 재지원 2. 목암생명과학연구소 https://www.jobkorea.co.kr/Recruit/GI_Read/48538386?Oem_Code=C1&sc=7 - 마감일: 2026.02.18 - 직무: Computational Biology & AI Drug Discovery - 규모: 63명 3. 블록스퀘어랩스 https://www.jobkorea.co.kr/Recruit/GI_Read/48481031?Oem_Code=C1&sc=7 - 직무: 암호화폐 데이터 분석가 - 규모: 40명 - 주요사업: 인공지능을 통한 암호화폐 시장 분석 및 실시 - 잡코리아 지원완료 4. 제이시스메디칼 https://www.jobkorea.co.kr/Recruit/GI_Read/48593208?Oem_Code=C1&sc=9 - 마감일: 2026.03.04 - 직무: 의료기기 Medical Publication 학술연구 - 규모: 322명 - 잡코리아 지원완료 5. AMC사이언스 https://www.jobkorea.co.kr/Recruit/GI_Read/48560721?Oem_Code=C1&sc=9 - 마감일: 2026.02.28 15시 00분 - 직무: 연구부문 > 생물정보학 > 오믹스분석 - 규모: 50명 6. 안랩 https://www.jobkorea.co.kr/Recruit/GI_Read/48547330?Oem_Code=C1&sc=7 - 마감일: 2026.02.18 - 직무: AI연구원 - 규모: 1,257명 - RAG Langchain 포트폴리오 추가 필요 / 코테 있음 7. 한국의약품수출입협회 https://www.jobkorea.co.kr/Recruit/GI_Read/48577565?Oem_Code=C1&sc=7 - 마감일: 2026.02.25 23시 50분 - 직무: 바이오의약품 품질관리 - 규모: 210명 8. 온택트헬스 https://www.jobkorea.co.kr/Recruit/GI_Read/48494748?Oem_Code=C1&sc=7 - 마감일: 2026.02.26 - 직무: 의료데이터 분석가 - 규모: 49명 - 잡코리아 지원완료 9. 케어네이션 https://www.jobkorea.co.kr/Recruit/GI_Read/48458801?Oem_Code=C1&sc=9 - 마감일: 상시채용 - 직무: 데이터 분석가 - 규모: 80명 - 잡코리아 지원완료 10. 삼양식품 https://www.jobkorea.co.kr/Recruit/GI_Read/48647279?Oem_Code=C1&logpath=1&stext=bioinformatics&listno=1&sc=630 - 마감일: 2026.04.24 / 채용시 마감 - 직무: OMICS Bioinformatics 연구원 - 규모: 2,880명 11. 안진회계법인 https://www.jobkorea.co.kr/Recruit/GI_Read/48550624?Oem_Code=C1&sc=7 - 마감일: 2026.02.26 16시 00분 - 직무: 생명과학 및 헬스케어 Consultant - 규모: 2,700명 12. 딥마인 https://www.jobkorea.co.kr/Recruit/GI_Read/48475038?Oem_Code=C1&sc=9 - 마감일: 상시채용 - 직무: 데이터 분석, 수요예측 분석 - 규모: 5명 - 잡코리아 지원완료 13. 넛지헬스케어 https://www.jobkorea.co.kr/Recruit/GI_Read/48534714?Oem_Code=C1&sc=9 - 마감일: 상시채용 - 직무: 캐시워크 데이터분석가 - 규모: 227명 - 코딩테스트 있음 14. 뉴엔에이아이 https://www.jobkorea.co.kr/Recruit/GI_Read/48577776?Oem_Code=C1&sc=9 - 마감일: 2026.04.11 - 직무: 소셜 빅데이터 분석 컨설턴트(데이터 사이언티스트) - 규모: 200명 15. 더웨이헬스케어 https://www.jobkorea.co.kr/Recruit/GI_Read/48504853?Oem_Code=C1&sc=9 - 마감일: 상시채용 - 직무: Medical Writing - 규모: 55명 16. 엑소시스템즈 https://www.jobkorea.co.kr/Recruit/GI_Read/48478200?Oem_Code=C1&sc=9 - 마감일: 2026.02.28 - 직무: 디지털헬스케어 AI엔지니어 - 규모: 14명 17. 뷰노 https://www.jobkorea.co.kr/Recruit/GI_Read/48580906?Oem_Code=C1&sc=9 - 마감일: 2026.03.12 - 직무: Clinical Researcher - 규모: 155명 18. 국립중앙의료원 https://www.jobkorea.co.kr/Recruit/GI_Read/48570410?Oem_Code=C1&sc=9 - 마감일: 2026.02.23 10시 00분 - 직무: 연구원 > 감염병정보통계연구팀 - 규모: 1,015명 - NCS 있는것같음. 19. 리디 https://www.jobkorea.co.kr/Recruit/GI_Read/48589768?Oem_Code=C1&sc=9 - 마감일: 2026.02.23 23시 00분 - 직무: Machine Learning Engineer - 규모: 457명 20. 유한양행 https://www.jobkorea.co.kr/Recruit/GI_Read/48545256?Oem_Code=C1&sc=9 - 마감일: 2026.02.19 10시 00분 - 직무: 임상의학본부 > 임상운영팀 - 규모: 2,100명 21. 셀타스퀘어 https://www.jobkorea.co.kr/Recruit/GI_Read/48586523?Oem_Code=C1&sc=9 - 마감일: 2026.04.12 - 직무: PV Specialist - 규모: 37명 22. 애이마 https://www.jobkorea.co.kr/Recruit/GI_Read/48538331?Oem_Code=C1 - 마감일: 2026.03.05 - 직무: Bioinformatics 연구원 - 규모: 10명 - 잡코리아 지원완료 23. 메디젠휴먼케어 https://www.jobkorea.co.kr/Recruit/GI_Read/48507151?Oem_Code=C1 - 마감일: 2026.03.30 - 직무: Bioinformatics 알고리즘 개발 및 데이터 분석가 - 규모: 34명 - 잡코리아 지원완료 메모1 지원완료한곳 - 에비드넷 (12일) - 블록스퀘어랩스 (12일) - 제이시스메디칼 (12일) - 온택트헬스 (12일) - 케어네이션 (12일) - 딥마인 (12일) - 애이마 (12일) - 메디젠휴먼케어 (12일) 2월 마감인곳 - 목암생명과학연구소 (02.18) - 유한양행 (02.19 10시 00분) - 국립중앙의료원 (02.23 10시 00분) - 리디 (02.23 23시 00분) - 온택트헬스 (02.26) - 안진회계법인 (02.26 16시 00분) - AMC사이언스 (02.28 15시 00분) - 삼양식품 (02.28) - 엑소시스템즈 (02.28) 3/4월 마감인곳 - 뷰노 (03.12) - 뉴엔에이아이 (04.11) - 셀타스퀘어 (04.12) - 삼양식품(04.24) 상시채용 - 케어네이션 - 넛지헬스케어 - 더웨이헬스케어 메모2 내기위해서 포폴수정이 필요한곳 - 목암생명과학연구소: pytorch/tensorflow등 딥러닝프레임워크 활용경험필요: AIops를 포폴에 추가하기 - 뉴엔에이아이: 프롬프트 엔지니어링을 포폴에추가 - 엑소시스템즈: MLDL 모델링경험 필요 - 리디: MLops 경험필요 오늘할일 - 이번주 당장내야하는 원서는 없음 - AIops를 포폴에 추가하자