AI &amp; Medicine

전체 글

[요약] Effect of Continuous Glucose Monitoring on Glycemic Control in Patients With Type 2 Diabetes Treated With Basal Insulin: A Randomized Clinical Trial (Thomas Martens, JAMA 2021) 2021.06.03
[요약] Pathdreamer: A World Model for Indoor Navigation (Jing Yu Koh, ArXiv 2021) 2021.06.01
[요약] From Motor Control to Team Play in Simulated Humanoid Football (DeepMind, ArXiv 2021) 요약 2021.05.31
[요약] Learning to Optimize Industry-Scale Dynamic Pickup and Delivery Problems (Xijun Li, ArXiv 2021) 2021.05.30
[요약] Improving Context-Based Meta-Reinforcement Learning with Self-Supervised Trajectory Contrastive Learning (Bernie Wang, ArXiv 2021) 2021.05.28

[요약] Effect of Continuous Glucose Monitoring on Glycemic Control in Patients With Type 2 Diabetes Treated With Basal Insulin: A Randomized Clinical Trial (Thomas Martens, JAMA 2021)

2021. 6. 3. 23:47

Author : Thomas Martens, Roy W. Beck, Ryan Bailey, et al.
Paper Link : https://doi.org/10.1001/jama.2021.7444

미국당뇨병학회(ADA)가 제1형 당뇨병환자들에게 연속혈당측정기(CGM; Continuous Glucose Monitoring)의 사용을 권고 하고 있으나, 제2형 당뇨병환자의 CGM사용과 그 효과에 대한 연구는 별로 이루어지지 않음
이에, 제2형 당뇨병 성인 환자 중 기저 인슐린치료를 진행중인 환자들을 대상으로 CGM의 효과를 분석하고자한 임상연구
총 175명의 환자 중 2:1의 비율로 CGM 사용 환자(n=116)와 채혈측정기 사용 환자(n=59)를 랜덤하게 배정함
CGM은 Dexcom사의 G6모델
8개월 동안의 HbA1c가 CGM 군은 -1.1%, 채혈측정기 군은 -0.6%로, 혈당관리에 있어 CGM의 사용이 유의한 효과가 있는것을 확인함

개인적인 Discussion

CGM 사용 군에서도 1/3은 8%이상의 높은 HbA1c를 보여주었다.
이는 단순히 자주 측정을 하는것에 더해, 적극적인 치료의 추천/개입/관리가 필요하다는것을 시사한다.
무엇보다, CGM의 사용을 적극 권장하기엔 현실적으로 CGM의 가격이 상당히 매우 정말 높으며, 센서를 부착한 생활에서 오는 불편함도 무시할 수 없다.
때문에, EHR정보 혹은 채혈측정 정보만으로도 좀더 혈당관리의 효과를 높힐수 있는 AI기반의 치료개입&관리추천 연구가 필요한것 같다.

'BIOMEDICINE > Diabetes' 카테고리의 다른 글

FreeStyle Libre 개인 혈당패턴 2주 관찰 (0)	2023.05.24
2021년 기대되는 당뇨병 신기술 2020.01.04 (1)	2021.01.14
[북마크] Learning Insulin-Glucose Dynamics in the Wild (Andrew C. Miller, 2020) (0)	2020.08.13
[북마크] An artificial intelligence decision support system for the management of type 1 diabetes (Nichole S. Tyler, Nature Metabolism, 2020) (0)	2020.06.05
[요약] Insulin-and-Pramlintide Artificial Pancreas (Ahmad Haidar, Diabetes Care, 2020) (0)	2020.01.29

[요약] Pathdreamer: A World Model for Indoor Navigation (Jing Yu Koh, ArXiv 2021)

2021. 6. 1. 11:25

Author : Jing Yu Koh, Honglak Lee, Yinfei Yang, Jason Baldridge, Peter Anderson
Paper Link : https://arxiv.org/abs/2105.08756v1

Video: https://www.youtube.com/watch?v=HNAmsdk7lJ4

구글 Dreamer의 실내 네비게이션 버전 연구
Dreamer의 핵심인 World model을 실내 이미지에 적용함
Dreamer가 아타리 게임, DeepMind control suit와 같은 시뮬레이션에만 적용됐다는 한계가 있은 반면, 이 연구에선 real world 이미지를 사용한다는 의의가 있음
실내 구조에 대한 semantic & depth 이미지를 world model로 학습하고, output을 GAN을 써서 좀더 사실적으로 렌더링
처음보는 실내환경에 대한 과거 path 이미지를 받으면 이후 path를 사실적으로 Dream하는것을 보여줌.

또한 VLN (Vision-and-Language Navigation) downstream 테스크에서 성능의 향상을 보여줌

Pathdreamer model architecture

단순히 그럴듯한 실내 이미지를 생성하는것이 아니라, 실내 구조에 대한 공간적 시간적 의미를 모두 담고있는 world model을 가지고 'path'를 생성해낸다는 점에서 의의가 있어보임. 저자의 말을 빌면 embodied navigation에 대한 가능성을 보여준것.

'AI & RL > Representation Learning' 카테고리의 다른 글

[북마크] Understanding How Encoder-Decoder Architectures Attend (Kyle Aitken, NeurIPS 2021) (0)	2021.11.14
[북마크] Understanding the World Through Action (Sergey Levine, CoRL 2021) (0)	2021.10.27
[요약] The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning (Yujin Tang, NeurIPS 2021 Spotlight) (0)	2021.09.13
[참고자료] Transformer VAE (0)	2021.08.19
[북마크] LILI: Learning Latent Representations to Influence Multi-Agent Interaction (Annie Xie, CoRL 2020) (0)	2020.11.17

[요약] From Motor Control to Team Play in Simulated Humanoid Football (DeepMind, ArXiv 2021) 요약

2021. 5. 31. 12:09

Author : Siqi Liu, Guy Lever, Zhe Wang, Josh Merel, S. M. Ali Eslami, Daniel Hennes, Wojciech M. Czarnecki, Yuval Tassa, Shayegan Omidshafiei, Abbas Abdolmaleki, Noah Y. Siegel, Leonard Hasenclever, Luke Marris, Saran Tunyasuvunakool, H. Francis Song, Markus Wulfmeier, Paul Muller, Tuomas Haarnoja, Brendan D. Tracey, Karl Tuyls, Thore Graepel, Nicolas Heess
Paper Link : https://arxiv.org/abs/2105.12196v1

Video: https://youtu.be/KHMwq9pv7mg

기존의 RL알고리즘의 연구결과들을 보면 목표를 잘 달성하긴하지만 행동은 불안정한 경우가 대부분이라는 점과 좁은 범위의 행동만을 수행하는 뚜렷한 한계가 있었으며, 이는 RL이 다른 DL 알고리즘들과 달리 널리 사용되지 못하는 이유중 하나임
사람의 경우 밀리초 단위의 자세제어 뿐만아니라 수십 초 길이의 비교적 긴 목표를 동시에 가지고 행동을 하고있으며, 더 나아가 주변 사람 및 환경과의 상호작용까지 이루어져 자연스럽고 거시적인 행동이 가능
이 논문에선 기존의 단순한 학습목표에 따른 부자연스럽고 근시적이었던 RL의 한계를 극복하고자 서로다른 행동레벨을 복합적으로 학습시키는 방법을 보여줌
Environment

Learning Framework

Internal Representation

'AI & RL > Reinforcement Learning' 카테고리의 다른 글

[북마크] Secrets of RLHF in Large Language Models Part I: PPO (Rui Zheng, Arxiv 2023) (0)	2023.09.11
[요약] Decision Transformer: Reinforcement Learning via Sequence Modeling (Lili Chen, NeurIPS 2021) (0)	2021.06.04
[정리] Trajectory Transformer: Reinforcement Learning as One Big Sequence Modeling Problem (Michael Janner, NeurIPS 2021 spotlight) (0)	2021.06.04
[정리] Soft Actor-Critic (Haarnoja, 2018) (2)	2020.01.21
MuJoCo 설치 (윈도우, Linux) [22.6.25 수정] (5)	2020.01.17

[요약] Learning to Optimize Industry-Scale Dynamic Pickup and Delivery Problems (Xijun Li, ArXiv 2021)

2021. 5. 30. 22:50

Author : Xijun Li, Weilin Luo, Mingxuan Yuan, Jun Wang, Jiawen Lu, Jie Wang, Jinhu Lu, Jia Zeng
Paper Link : https://arxiv.org/abs/2105.12899v1

화웨이 Noah's Ark 랩에서 나온 물류 최적화 연구.

다른 RL을 사용한 조합최적화 연구와 비슷한 접근으로서 역시 GNN와 RL을 사용함
Attenion-based GNN + Double DQN

전체 물류비용을 평균적으로 13.12% 줄임

'AI & RL > Combinatorial Opt.' 카테고리의 다른 글

[참고자료] RL for Combinatorial Optimization (CO) (0)	2021.03.05

[요약] Improving Context-Based Meta-Reinforcement Learning with Self-Supervised Trajectory Contrastive Learning (Bernie Wang, ArXiv 2021)

2021. 5. 28. 14:20

Author : Bernie Wang, Simon Xu, Kurt Keutzer, Yang Gao, Bichen Wu
Paper Link : https://arxiv.org/abs/2103.06386

Context-based Meta-RL이 training task의 넓은 distribution에 반해 상대적으로 적은 정보로만 학습된다는 단점에서, Context Encoder의 학습에 Contrastive Learning을 추가함.
Overview Figure

Algorithm Figure

Result Figure on MuJoCo

Off-line Meta-RL인 PEARL보다 사실 성능은 크게 차이나지 않는편. (Average 1.3배, Median 1.14배)
Meta-World환경에서도 PEARL과 비교를 했는데, 50개 Task 중에서 44개에서 성능이 높지만, 크게 차이나진 않은편. (Average 4.3배, Median 1.4배; 즉 몇몇 특정 task에서 훨씬 잘한 케이스)
하지만 이 논문에서 의미있는 부분은 embedding된 task representation 부분
Meta-world의 Push-v1 환경에서, 서로 다른 위치에 물건을 옮기는 10개의 task에 대한 PEARL과 Contrastive Learning을 추가한 알고리즘 각각의 representation space를 비교.

각 task마다 200번을 rollout한뒤 샘플된 trajectroy를 t-SNE를 사용하여 2차원 시각화 한 결과 Contrastive Learning을 적용한 알고리즘에서 보다 명확하게 clustring이 된것을 확인할 수 있음.

논문에 대한 나의 의견

개인적으로 context-based Meta-RL은 agent의 행동에 잠재적으로 내포된 goal을 Explainable하게 시각화 할수 있다는 점이 큰 장점이라 생각한다. 이 논문에서 사용한 Contrastive Learning은 이러한 장점을 더 극대화 할수 있는 방법을 제시한것이라 볼 수 있으며, 성능은 크게 좋아지지 않았지만 신뢰도가 중요한 field에 적용할 경우 충분히 의미가 있을것 같다.

'AI & RL > Meta & Multi-Task RL' 카테고리의 다른 글

[요약] A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning (Mingde Zhao, NeurIPS 2021) (0)	2021.10.02
[북마크] Bootstrapped Meta-Learning (Sebastian Flennerhag, ICLR 2022 Oral) (0)	2021.09.22
[정리] VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning (Luisa Zintgraf, ICLR 2020) (0)	2021.01.31
[북마크] MELD: Meta-Reinforcement Learning from Imagesvia Latent State Models (Tony Z. Zhao, CoRL 2020) (0)	2020.11.05
[정리] PEARL: Efficient Off-policy Meta-learning via Probabilistic Context Variables (Kate Rakelly, ICML 2019) (2)	2020.05.27

PREV 1 ···14 15 16 17 18 19 20 ···23 NEXT

AI & Medicine