Clash of the Titans AI: 재치와 지혜의 전투에서 ChatGPT 대 Bard

Clash of the Titans AI: 재치와 지혜의 전투에서 ChatGPT 대 Bard

오늘날 AI 기반 생성 챗봇의 세계에서 우리는 11월에 소개된 OpenAI의 ChatGPT에 이어 2월에 Bing Chat, 3월에 Google의 Bard가 갑자기 등장하는 것을 목격했습니다. 우리는 AI 챗봇 영역을 지배하는 것이 무엇인지 결정하기 위해 일련의 작업을 완료하여 이러한 챗봇을 테스트하기로 결정했습니다. Bing Chat은 최신 ChatGPT 모델과 동일한 GPT-4 기술을 사용하므로 AI 챗봇 기술의 두 거물인 OpenAI와 Google에 집중하기로 했습니다.

아빠 농담, 논쟁 대화, 단어 수학 문제, 일반화, 사실 찾기, 창의적 글쓰기, 코딩 등 7가지 중요한 범주에서 ChatGPT와 Bard를 테스트했습니다. 각 테스트에 대해 ChatGPT(GPT-4 포함) 및 Google Bard에 동일한 명령(“힌트”라고 함)을 입력했습니다. nit-picking 없이 첫 번째 결과를 사용했습니다.

이전 GPT-3.5 모델을 기반으로 한 ChatGPT 버전도 사용할 수 있지만 테스트에서는 사용하지 않았습니다. 우리는 GPT-4만 사용했기 때문에 혼란을 피하기 위해 이 글에서는 ChatGPT를 “ChatGPT-4″로 지칭하겠습니다.

분명히 이것은 과학적 연구는 아니지만 챗봇의 기능을 재미있게 비교하기 위한 것입니다. 결과는 무작위 요소로 인해 세션마다 다를 수 있으며 다른 단서를 사용한 추가 평가는 다른 결과를 생성합니다. 또한 이러한 모델의 기능은 Google과 OpenAI가 지속적으로 업그레이드함에 따라 시간이 지남에 따라 빠르게 변화할 것입니다. 그러나 현재로서는 2023년 4월 초의 상황입니다.

아빠 농담

재치 경쟁을 뜨겁게 달구기 위해 우리는 ChatGPT와 Bard에게 농담을 써달라고 요청했습니다. 그리고 아빠 개그는 개그의 정점인 만큼 챗봇 두 대가 색다른 개그를 내놓을 수 있을지 궁금했다.

힌트: 독창적인 아빠 농담 5개를 작성하세요.

Bard의 다섯 가지 아빠 농담 중 Google 검색을 사용하여 인터넷에서 세 가지 말 그대로를 찾았습니다. 한 가지 예(“포도”)는 Mitch Hedberg 농담 트윗 에서 절반을 차용했지만 해석하고 싶지 않은 불행한 말장난으로 인해 손상되었습니다. 그리고 놀랍게도, 우리가 다른 곳에서는 찾을 수 없지만 말이 되지 않는 독창적인 농담(달팽이에 관한)이 하나 있습니다.

한편, 5개의 ChatGPT-4 아빠 농담은 100% 원본이 아니며 모두 다른 출처에서 가져왔지만 정확하게 전달되었습니다. 아버지의 농담은 아마도 영리하다기보다는 신음할만한 가치가 있다고 생각되기 때문에 여기서 Bard가 ChatGPT-4를 대체한 것 같습니다. Bard는 또한 (우리의 지시에 따라) 독창적 인 농담을 시도했지만 그중 일부는 부끄러운 방식 (아빠의 정신에 있음)으로 끔찍하게 실패했으며 말하자면 의도 치 않게 발을 입에 넣었습니다. 아빠도 닮았다).

승자: 바드

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다