동빈나
오늘 영상에서 다루는 논문은 GPT-2처럼 큰 언어 모델(large language model)에서 학습 데이터(training data)를 추출하는 공격 방법을 제안합니다. 본 논문은 2020년 12월에 출간되었으며, 다양한 AI 서비스에서 널리 쓰이고 있는 “학습된 GPT-2 네트워크로부터 해당 네트워크가 학습 당시에 사용했던 개인정보가 포함된 학습 데이터”를 추출하는 것이 가능함을 보였습니다.
실제로 최근에는 다수의 AI 서비스에서 큰 규모의 언어 모델이 많이 활용되고 있는 만큼, 이 논문의 내용은 큰 이목을 끌었습니다. 심지어 국내(대한민국)에서도 2021년 초에 대규모 언어 모델 기반의 유명 챗봇 서비스에서 개인정보 유출(privacy leakage)의 문제점이 지적된 사건이 있었습니다.
본 논문에서 제안한 메서드는 언어 모델을 기반으로 하는 서비스가 배포되기 전에, 모델의 취약점을 분석하기 위한 목적으로 효과적으로 사용될 수 있습니다. 특히 본 논문은 딥러닝 보안 분야에서 잘 알려진 연구자인 Nicholas Carlini, Florian Tramer가 참여한 논문이기도 합니다.
논문 제목: Extracting Training Data from Large Language Models
논문 링크: https://arxiv.org/abs/2012.07805
학습 기대 효과
① 딥러닝 기반의 큰 언어 모델에 대한 개인정보 추출 공격 방법을 이해할 수 있습니다.
② 언어 모델 AI 서비스를 운영하는 입장에서 개인정보를 보호하기 위한 대응책을 이해할 수 있습니다.
강의 특징
30장가량의 PPT로 구성되며, 논문 핵심 내용 요약을 포함하는 강의입니다.
감사합니다
감사합니다!
좋은 영상 감사합니다.
뭔 소린지 당연히 모르지만 그냥 보고있으면 지식인이 된거 같아서 봅니다.
형 좋좋소 나왔어 리뷰 좀 해줘..
그리고 Chain Rule 설명 부분에서 joint probability를 이용하는거면, 단어의 순서는 어떻게 적용이 되는건가요? 예를 들어 P(친구와, 친하게, 지낸다) = P(지낸다, 친구와, 친하게)와 같아 지지 않나요?
뭔 소린지 당연히 모르지만 그냥 보고있으면 지식인이 된거 같아서 봅니다.
좋좋소에 댓글남기신거보고왓어요 구독하고 갑니다
논문 리뷰 자료는 유튜브로 공유하시려고 직접 정리하시는 건가여?? 진짜 성실하십니다 ㅎㅎ !
혹시 예전처럼 비대면 화상으로 질의응답 시간 가질 계획 있으실까요?
오 유튜브에서 이렇게 깊고 자세하게 알려주는분은 처음보는거같아요. 혹시 파이썬으로 웹개발 하는 강의도 찍어주실수있나요? 혼자 공부하고있는데, 책이나 검색만으로는 다소 어렵네요ㅜㅜ
어려운 논문을 쉽게 설명해주셔서 항상 감사의 말씀을 드립니다.
저 같은 경우 논문을 보기 전에 수학 식을 항상 지렛 겁먹고 논문을 포기해버리는데…. 수학 공부를 어디서 부터 시작해야할지 막막한데 조언좀 부탁드릴 수 있을까요?
(이게 한국어여 영어여?? ㅇㅁㅇ) 점점 듣다보니 익숙해지고 있습니다, 좋은 영상 감사합니다
어라 나 분명히 오징어 게임 리뷰 보고 있었는데,,
동빈님 한 가지 질문이 있습니다. k-Eidetic memorization의 정의에 의하면 document 단위로 memorization 횟수를 따지는 것으로 이해하였는데, 언어모델이 문자(token) 단위로 훈련하는 만큼 document 단위가 아니라 단어 단위로 memorization 횟수를 카운팅해야 하는건 아니었는지 궁금합니다.