2025-06-24 ⋯ 변이 클러스터링 연구 #5 결과 검증: 계통 결정 돌연변이와 연관성
1. Load package 2. Load data 만든건 저장.
2025-06-24 ⋯ 변이 클러스터링 연구 #4 알고리즘 성능 평가 - k dist plot
1. Load package 2. Load data 3. K-dist plot
2025-06-20 ⋯ 변이 클러스터링 연구 #3 결과 검증: 임상 결과와의 연관성
1. Load package 2. Load COVID19 data 3. Select severity related hotspots 만든건 저장하기.
2025-06-20 ⋯ 변이 클러스터링 연구 #2 변이 중요도 계산
1. Load package 2. Load GISAID data 3. Calculate H-score 4. Save
2025-06-20 ⋯ 변이 클러스터링 연구 #1 알고리즘 실행
1. Load package 2. Find CCMs 3. Perform clustering
2025-06-17 ⋯ 항생제 TFT 연구 #2 입력 feature 생성
1. Load package 2. Previous 항생제 169종에 대해서 size 10 sequence를 생성했었는데 - 모델 입력 feature로 다음을 제외하는대신 1) antibiotics 리스트 2) strain 리스트 - 저 2개 feature를 반영하는 새로운 feature를 2개 생성하려고 한다: 1) 현재 antibiotics가 현재 strain 환자의 NEWS를 감소시킨 이력이 있는지? (binary: 0/1) 2) 현재 antibiotics가 NEWS를 감소시키는데 소요 기간은? (범주형: short/mid/long) 3. Create feature1 먼저 feature1을 생성하기 위해 - 투여 후 NEWS가 감소한 sequence를 남기고 - keep된 sequence의 균주-항생제 pair를 얻는데 - 이때 '투여 후 NEWS의 감소'는? - 투여 전날(D-1) NEWS 수치와 - 투여 후 7일(D+0~D+6)를 봣을때 - 투여 후 최고치가 투여 전날보다 낮으면 NEWS가 감소한 것으로 보았다. Dexamethasone에 대해 selected sequence를 시각화한것을 보면 - 투여일(점선) 이후의 NEWS 수치들이 투여전날보다 낮은 것만 잘 선택된것을 확인 가능하다! keep된 sequence의 균주-항생제 pair를 얻을 때는 - 각 항생제에 대해 - selected sequence의 투여 전날(D-1) 균주(들)에 해당 항생제 매핑 - 하는 방식으로 수행했다. 균주별 효과 항생제 딕셔너리 strain_dic를 확인해보면 - 98개 균주에 대해 - 효능을 보인(것으로 추정되는) 항생제 목록이 제대로 생성돼있다! 만든건 저장하기. 4. Create feature2 feature2는 솔직히 좀 애매한데 로직을 짜보면 - 일단 투여 후 NEWS가 감소한 sequence를 모두 모으고 - '일정 수준'이하로 감소하는데 소요된 시간을 봐서 (ex. 3이하는 moderate니까 3까지 도달하는데 소요된 날짜) - 상위 30%/하위30%/나머지 << 이런 식으로 가려고 했으나? - sequence의 선택 기준이 '투여 전날 news'로써 - sequence마다 기준이 달랐기때문에 - y축 즉 news 범위가 다 달라서 절대적인 값으로 설정하기 어려울거같다. (ex. 투여 전날 최고치가 3보다 낮을 수도 있음. 또는 투여후 3 아래로 안떨어지는 날이 있을수도있음) - 그래서 상대적인 값으로 볼까 했는데? - 기준을 '절반 이하로 떨어지기'로 잡는다고 치면 - news가 1. 전날 12 -> 8로 감소 2. 전날 3 -> 1.5로 감소 - 인 경우 1은 좋은 데이터지만 non selected 되어 라벨링되지않고 2는 별로인 데이터지만 selected 되어 라벨링되게된다. 결론: feature2는 일단 보류하기.
2025-06-17 ⋯ 항생제 TFT 연구 #1 입력 데이터 생성
Load package Check data 4515명 환자 데이터이고 첫번째 환자 '74374'의 데이터를 확인해보면 날짜, NEWS 중증도 점수, 항생제 투여 횟수, 항생제 투여 종류, 균주 정보가 있다. 항생제 종류는 169종이고 각 항생제에 따라 NEWS sequence를 생성해서 input data를 만들 예정이다. Make sequence 항생제별로 sequence를 분리해서 위의 raw_data와 동일한 형식의 딕셔너리 169개를 outdir에 생성했다. 이제 생성한 sequence의 길이를 10으로 맞출건데, 항생제 투여 시점 기준으로
- 투여 전 3일부터
- 투여 후 7일(D-3 ~ D+6)
- 10일짜리 NEWS sequence를 만들어줄 예정이다. 각 항생제에 따라 10 day sequence를 생성해서 outdir에 저장했다. 항생제 'Dexamethasone'에서 생성된 sequence를 확인해보면
- 783개 sequence가 생성되었고
- 투여일(21일) 기준으로 투여전 3일, 투여후 7일로 잘 생성된것을 확인 가능하다!
2025-05-28 ⋯ 연구실 bashrc 스크립트
local cobi2 cobi3 cobi4