구글 바드가 내 블로그나 웹 사이트를 학습하지 못하게 하는 옵션 발표

 좀 괘씸합니다. 구글 바드나 챗GPT나 네이버 하이퍼클로바X는 다양한 웹 사이트와 블로그 정보를 보고 학습을 합니다. 그 학습한 내용을 가지고 답변을 하죠. 문제는 이렇게 허락도 없이 웹 사이트나 블로그 내용을 보고 학습을 하게 되면 블로그나 웹 사이트 운영자는 피해를 받습니다. 

우리가 웹사이트나 블로그를 공짜로 볼 수 있는 이유는 광고 때문입니다. 구글 애드센스나 네이버 애드포스트 같은 광고 수익이 있기에 양질의 콘텐츠를 정보를 올릴 수 있습니다. 아무 수익이 없는데 블로그 운영할 사람이 몇이나 있을까요. 

그런데 챗GPT나 구글 바드나 네이버 하이퍼클로바X는 허락도 없이 남의 웹 사이트나 블로그 정보를 무단으로 긁어가서 학습해서 2차 콘텐츠를 만듭니다. 이에 많은 웹사이트 운영자와 블로거들이 화가 나 있습니다. 

구글 바드나 Vertex AI가 내 웹사이트 블로그 내용을 보고 학습하지 못하게 하는 옵션

구글 바드

구글은 구글 바드와 기계학습플랫폼인 Vertex AI를 운영하고 있습니다. 생성형 AI 모델의 개발에 있어서 다양한 웹 페이지, 블로그 포스팅으로 기계 학습을 하고 있습니다. 지금까지는 이걸 무단으로 허락도 없이 마구 사용했는데 많은 비난이 들끓자  생성형 AI가 학습을 못하게 하는 옵션을 공개했습니다. 

구글 바드


2023년 9월 28일 구글 블로그에는 구글의 부사장인 '다니엘 로만'이 우리는 AI 원칙에 따라 소비자 개인정보 보호에 대한 책임을 지기 위해서 생성형 AI가 학습을 못하게 하는 옵션을 공개했습니다. 

지금까지 많은 웹사이트 운영자로부터 생성형 AI로 인해 피해를 보고 있다는 소리를 많이 들었다고 해요. 구글이 웹 사이트 운영자들의 목소리를 무시할 수 없는 것이 구글 애드센스 수익을 올리려면 수 많은 웹 사이트와 블로그가 있어야 합니다. 이들의 목소리를 귀담아 듣지 않을 수가 없습니다. 블로그 웹사이트와 구글 애드센스는 공생관계이니까요. 

이에 웹사이트 운영자들이 검색 엔진 크롤러가 내 웹사이트, 블로그를 방문해서 색인을 하는 것을 허락하는 파일인 robots.txt 파일에 다음과 같은 문구를 넣으면 생성형 AI가 블로그와 웹사이트 내용을 학습하지 않습니다. 

User-agent: Google-Extended
Disallow: /

 구글은 이렇게라도 무슨 행동을 하는데 네이버는 아무것도 없네요. 네이버 블로그 글은 물론 티스토리 글까지 그냥 무단 수집하고 학습하고 있습니다. 

구글의 이런 행동은 이런 문제가 발생할 수 있음에도 수년 전 부터 방치하고 있고 무단으로 생성형 AI 학습을 시켜놓고 여론이 안 좋자 마지 못해서 내놓았다면서 비난을 받고 있습니다. 그런데 왜 오픈 AI의 챗GPT는 욕을 안 먹을까요. 안 먹는 게 아니라고 오픈 AI는 더 많은 욕을 먹고 있습니다. 구글 바드는 무료지만 챗GPT는 유료 버전도 있거든요. 

그리고 네이버 하이퍼클로바X도 욕을 먹어야 합니다. 재주는 곰이 넘고 돈은 사육사가 번다는 건데 문제는 이 곰이 사람을 물어 버릴 수도 있는 곰입니다. 이런 비윤리적 행동에 대해서 그나마 구글은 마지못해서 대책을 내놓았네요. 


댓글

이 블로그의 인기 게시물

삼양렌즈 유일한 AS센터 남대문 삼정사 방문기

소니 무선 이어폰 WF-1000XM4 한쪽 배터리 광탈 문제 평생 무상 교체 가능

35mm 필름 1장에 2장의 사진을 찍을 수 있는 코닥 Ektar H35N 하프 프레임 필름 카메라