AI &amp; Medicine

전체 글

[북마크] Multimodal biomedical AI (Julián N. Acosta, Nature Medicine 2022) 2022.11.06
[요약] Causal Transformer for Estimating Counterfactual Outcomes (Valentyn Melnychuk, ICML 2022) 2022.10.20
NAVER CLOVA 초거대 인공지능 API 의료분야 적용 경진대회 '최우수상' 수상 2022.09.21
메타러닝 도서 표지와 최종 편집본 2022.09.21 3
[참고자료] Transformer for tabular data 2022.07.25

[북마크] Multimodal biomedical AI (Julián N. Acosta, Nature Medicine 2022)

2022. 11. 6. 12:59

Author: Julián N. Acosta, Guido J. Falcone, Pranav Rajpurkar & Eric J. Topol
Paper Link: https://www.nature.com/articles/s41591-022-01981-2

최신 foundation model들 까지 고려한 Eric Topol교수님의 의료 데이터에서의 multimoality에 대한 리뷰 페이퍼.

'MEDICAL & HEALTHCARE AI' 카테고리의 다른 글

[북마크] Almanac: Retrieval-Augmented Language Models for Clinical Medicine (Cyril Zakka, Arxiv2023) (0)	2023.06.08
[요약] Med-PaLM: Large Language Models Encode Clinical Knowledge (Karan Singhal, Nature 2023) (0)	2022.12.30
[참고자료] AI in health and medicine (Pranav Rajpurkar, Nature Medicine 2022) (0)	2022.02.12
[요약] Targeted-BEHRT: Deep learning for observational causal inference on longitudinal electronic health records (Shishir Rao, ArXiv 2022) (0)	2022.02.12
[북마크] G-BERT: Pre-training of Graph Augmented Transformers for Medication Recommendation (Junyuan Shang, IJCAI 2019) (0)	2022.01.17

[요약] Causal Transformer for Estimating Counterfactual Outcomes (Valentyn Melnychuk, ICML 2022)

2022. 10. 20. 00:36

Author: Valentyn Melnychuk, Dennis Frauen, Stefan Feuerriegel
Paper Link: https://arxiv.org/abs/2204.07258

Code: https://github.com/Valentyn1997/CausalTransformer

ICML slide: https://icml.cc/media/icml-2022/Slides/17693.pdf

ICML presentation: https://slideslive.ch/38983812/causal-transformer-for-estimating-counterfactual-outcomes?ref=recommended

Time-varying confounder를 다루기 위해 CRN에서 LSTM을 사용한것과 달리 여기선 Transformer사용하여 길고 복잡한 sequence 데이터를 더 잘 다루고자 함
- 저자 피셜 Transformer를 causal inference에 최초로 적용한 사례
selection bias를 줄이기 위해 representation을 balancing 하는 접근을 택했고, 그 방법으로는 CRN과 같은 adversarial objectjve를 사용했으나 loss로는 doimain confusion loss를 사용했다는 차이첨이 있음
- CRN의 방식은 학습속도 파라메터에 민감하기 때문에 자신들의 접근이 더 낫다 설명하고 실험으로 검증

[Domain confusion loss]

[Gradient reversal]

실험 결과 time dependent confounder 및 long term prediction 모두에서 기존 방법들 대비 높은 counterfactual 정확성을 보여줌

'AI & RL > Causal Inference' 카테고리의 다른 글

[북마크] Zero-shot causal learning (Hamed Nilforoshan, NeurIPS 2023) (0)	2023.09.30
[북마크] Conformal Meta-learners for Predictive Inference of Individual Treatment Effects (Ahmed Alaa, NeurIPS 2023) (0)	2023.09.25
[요약] Shaking the foundations: delusions in sequence models for interaction and control (Pedro A. Ortega, ArXiv 2021) (0)	2022.02.11
[정리] Time Series Deconfounder: Estimating Treatment Effects over Time in the Presence of Hidden Confounders (Ioana Bica, ICML 2020) (0)	2022.02.07
[북마크] Learning "What-if" Explanations for Sequential Decision-Making (Ioana Bica, ICLR 2021) (0)	2022.01.27

NAVER CLOVA 초거대 인공지능 API 의료분야 적용 경진대회 '최우수상' 수상

2022. 9. 21. 15:16

네이버의 초거대 인공지능 하이퍼클로바를 이용하여 의료분야에 적용해보는경진대회에서 최우수상을 수상하였습니다.

'PERSONAL PROJECTS > Awards & Honours' 카테고리의 다른 글

DMJ 논문 Best paper of the year 선정 (0)	2021.07.02

메타러닝 도서 표지와 최종 편집본

2022. 9. 21. 15:03

스탠포드 첼시핀 교수님의 CS330강의가 공개되면서 부터, 동료들과 함께 집필을 시작한 메타러닝 첫 한국어 도서집필 프로젝트입니다. 최종 편집본이 오늘 나왔는데 총 282쪽이네요.

출판은 위키북스를 통해 진행했으며, 책의 검수에는 고려대학교 인공지능학과의 최성준 교수님께서 연구/교육/업무로 정말 바쁘신 와중에 시간을 내어주셨습니다. 나중에 최종 출판이 되면 다시한번 감사드리겠지만, 최종 편집을 하려 PDF를 열때마다 부족한 저희에게 시간을 할애해 주신 최성준 교수님께 매번 감사하는 마음이 들었습니다.

표지의 동물은 오리너구리로 포유류이면서도 조류와 같이 알을 낳는 등 여러 동물들의 특성을 모두 가지고 있는데, 실제 유전적으로도 포유류, 조류, 파충류가 혼합되어 있다고 합니다. 환경에 맞춰 다양하게 퍼져나가는 진화가지를 내포한듯한 이러한 특징이 마치 메타러닝과 비슷하다고 생각하여 이번 메타러닝 책의 표지로서 오리너구리를 택하게 되었습니다.

마지막으로 귀여운 실제 오리너구리 사진 보시겠습니다.

[참고자료] Transformer for tabular data

2022. 7. 25. 10:07

논문 리스트

TabTransformer: Tabular Data Modeling Using Contextual Embeddings (Xin Huang, arXiv 2022)

Paper Link: https://arxiv.org/abs/2012.06678
Talk: https://www.youtube.com/watch?v=-ZdHhyQsvRc
AWS Code: https://github.com/awslabs/autogluon/tree/master/tabular/src/autogluon/tabular/models/tab_transformer
Other Repo 1: https://github.com/lucidrains/tab-transformer-pytorch
Other Repo 2: https://github.com/timeseriesAI/tsai/blob/main/tsai/models/TabTransformer.py

by AWS
Embedding layer로서 Transformer를 사용
Tabular데이터에 대해 각 column에 대하여 Column Embedding 수행 후 Trasformer를 사용해 context embeddings를 생성
생성된 context embeddings는 concat하여 MLP classifier로 들어감
Column Embedding
- 한 column이 d개의 클래스를 가지고 있을땐 missing value도 인덱스를 부여해 0부터 d+1까지의 lookup table로 인코딩
- one-hot보다 parametric embedding을 학습하는것이 더 나은 성능을 보여줌
- scalar column에 대해서는 3가지 방법의 re-scaling (quantiles, normalization, log)과 quantization을 방법을 모두 사용하여
- column identifier와 feature value를 따로 embedding하여 concat
- embedding dimension의 4, 28을 각각 column과 value dim으로 사용
Transformer 아키텍쳐
- Transformer hiddem dim: 32
- Transformer layer: 6
- Transformer multi-head: 8

MET: Masked Encoding for Tabular Data (Kushal Majmundar, Arxiv 2022)

Paper Link: https://arxiv.org/abs/2206.08564

by Google Research India
Masked-AutoEncoder(MAE)방식의 SSL을 사용하여 tabular data의 embedding을 학습
MAE Contributions:
1. Downstream 테스크에 embedding을 전달할때 column별 context embedding을 average가 아닌 concatnation하여 전달
2. 입력 데이터에 adversarial perturbation을 추가
인코더와 디코더 모두 Transformer사용
mask되지 않은 column에 한하여, column identifier로서 학습가능한 e크기이 embedding과 feature value의 scalar를 concatation해 e+1 차원의 embedding이 생성되어 Transformer 인코더의 입력으로 들어감
mask된 column은 column identifier와 학습가능한 special token으로서의 mask scalar를 contatation하여 masked embedding을 생성
Transformer 인코더를 커쳐나온 context embedding에 masked embedding을 합쳐 Transformer 디코더에 넣어 전체 column을 복원
Downstream task에 전달할때 contexted embedding column들에 대하여 average가 아닌 concat하여 전달

Tabular Transformers for Modeling Multivariate Time Series (Inkit Padhi, ICASSP 2021)

Paper Link: https://arxiv.org/abs/2011.01843
Code: https://github.com/IBM/TabFormer

by IBM
Tabular 데이터에 대한 BERT 및 GPT스타일의 sequence encodeing
TabBERT
- 시간에 따른 각 row를 Field Transforer를 사용하여 row embeeding한 다음 token으로서 BERT에 입력
- Mask는 row단위가 아닌 row의 field단위로 mask하여 이를 예측하도록 학습
TabGPT
- 각 row들을 [SEP]로 분리하면서 연속되게 이어서 입력으로 주며, 현재의 row가 들어갔을때 미래의 row들을 예측하도록 학습
Continuous column은 quantization을 수행하여 categorical column으로 변환

TAPEX: Table Pre-training via Learning a Neural SQL Executor (Qian Liu, ICLR 2022)

Paper Link: https://arxiv.org/abs/2107.07653
Code: https://github.com/microsoft/Table-Pretraining

by Microsoft
아키텍쳐로 BART를 사용

Revisiting Deep Learning Models for Tabular Data (Yura Gorishniy, NeurIPS 2021)

Paper Link: https://arxiv.org/abs/2106.11959v2
Code: https://github.com/Yura52/tabular-dl-revisiting-models

by Yandex
Feature Tokenizer를 통과한 토큰들과 [CLS]토큰을 사용한 prediction
각 column별로 weight와 bias가 있어 이를 개별 embedding
catetorical column의 경우 lookup table에서 각 카테고리에 해당하는 벡터를 onehot vector와 곱해준 뒤 각 column에 해당하는 bias vector를 더해줌

On Embeddings for Numerical Features in Tabular Deep Learning (Yura Gorishniy, arXiv 2022)

Paper Link: https://arxiv.org/abs/2203.05556v1
Code: https://github.com/Yura52/tabular-dl-num-embeddings

by Yandex
Tabular 데이터의 numerical feature에 대한 feature binning을 어떻게 하는게 좋은지에 대한 연구
Token화 한 tabular 데이터를 Transforemr에 태워 prediction 테스크 수행
scalar를 바로 넣어주는것 보다 one-hot의 개선된 버전인 PLE(piecewise linear encodding)을 사용할 경우 CatBoost보다 나은 성능을 보여주기도 함

Revisiting Pretraining Objectives for Tabular Deep Learning (Ivan Rubachev, arXiv 2022)

Paper Link: https://arxiv.org/abs/2207.03208
Code: https://github.com/puhsu/tabular-dl-pretrain-objectives

by Yandex

그 외 깃헙 레포 리스트

https://github.com/yandex-research/rtdl (위 Yandex사의 3개 논문 종합 레포)

'AI & RL > Representation Learning' 카테고리의 다른 글

[북마크] Pure Transformers are Powerful Graph Learners (Jinwoo Kim, Arxiv 2022) (0)	2022.07.12
[북마크] Understanding How Encoder-Decoder Architectures Attend (Kyle Aitken, NeurIPS 2021) (0)	2021.11.14
[북마크] Understanding the World Through Action (Sergey Levine, CoRL 2021) (0)	2021.10.27
[요약] The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning (Yujin Tang, NeurIPS 2021 Spotlight) (0)	2021.09.13
[참고자료] Transformer VAE (0)	2021.08.19

PREV 1 ···4 5 6 7 8 9 10 ···23 NEXT

AI & Medicine