AI 윤리 파트의 경우 사실 그냥 개론과 같은 내용이라… 한 글에 간단하게 정리하기로 했다.
1. 데이터 분석과 AI 학습에서 유의할 점
데이터 처리 및 수집에서 윤리 이슈
- 데이터 해석과 관련된 오류 주의: 상관관계 ≠ 인과관계
- 상관관계: 두 대상이 관련성이 있다고 추측
- 인과관계: 한 사건이 다른 사건의 원인이 되는 관계
- 예) 초콜릿 소비량과 노벨상 수상자 수
데이터 분석의 핵심 요소
- 데이터 전처리
- Error bar 추가
- 아웃라이어 제거 및 데이터 표준화
- 적합한 통계 테스트 선택
- EDA: 충분한 시간 할애
- 학습 데이터 품질:
- Underfitting, Overfitting 방지
- 학습 데이터 ≠ 테스트 데이터
AI 모델의 성능 및 설명력
- 블랙박스 알고리즘의 한계:
- 설명력 부족 문제
- Saliency map, SHAP 등 설명 가능한 AI 기술 활용
- 노이즈 민감성:
- 예) One pixel attack
웹 데이터 활용의 한계와 주의점
- 데이터의 대표성 부족:
- Spiral of silence 현상
- 인포데믹(Infodemic) 주의
- 사용자 중심 서비스 필요:
- 원치 않는 광고, 유해 콘텐츠 노출 등 배제
- 개인정보 보호 강화 (GDPR 등)
2. AI 윤리 (AI Ethics)
창의성과 저작권
- AI와 예술:
- GAN을 이용한 창작물의 저작권 이슈
- AI 작품은 창작성을 가질 수 있는가?
- 법적 제도:
- 학습 데이터 제공자에게 혜택 돌아가지 않음
- NFT, 저작권 문제 등
AI의 사회적 영향
- 로봇과 윤리:
- 아시모프의 로봇 3원칙
- 자율주행차 사고 시 책임 문제
- 로봇 인격화:
- 로봇 학대는 인간성에 부정적 영향
3. 세계적인 데이터 과학자가 되는 방법
데이터 과학자 인사이트
- 이종 데이터의 결합이 혁신을 가져옴:
- 예) 통신사 데이터를 활용한 대중교통 최적화
- 소셜 네트워크 데이터를 통한 정치 성향 분석
- 빅데이터와 AI 기반 계산과학의 발전
목표 달성과 성장
- 일상 속 데이터 관심: 꾸준한 학습과 결과 창출
- 실행력: 계획한 것을 바로 실행
- "What gets scheduled, gets done."
- 도전적 목표 설정:
- 50% 성공 확률의 목표 설정
- 지속적인 목표 조정과 실패를 두려워하지 않기
레이 달리오의 성공 원칙
- 목표 설정
- 문제 발견
- 근본 원인 분석
- 해결 계획 수립
- 실행