오픈 AI 빠른 발전과 영향력에 대항하는 구글의 새로운 차세대 언어모델 제미나이의 등장이 흥미롭다.
오늘은 새롭게 등장한 구글의 적토마 제미나이와 그에 앞서 이미 등장해서 자리를 잡은 듯한 바드 그리고 GPT 4에 대해 공통점, 차이점 그리고 현재 사람들의 제미나이에 대한 시각을 간단히 정리해 보겠다.
제미나이(GEMINI) 뭐야?
제미나이란 구글 AI에서 개발한 대규모 언어 모델(LLM)로 2023년 12월에 출시되었다., 텍스트와 이미지, 오디오 등 다양한 데이터 세트로 학습되었고 인간의 특성을 폰툰“태생적 멀티모달모델(NATIVELY MULTIMODAL MODEL)이다. 제미나이의 뜻은 TWIN란 “쌍둥이 자리”“쌍둥이자리”를 의미로 인간과 AI가 같다는 즉. 인간을 닮은 AI를 만들려는 구글의 의지를 보여준다. 실제로 제미나이가 주어지는 모든 정보를 취합해 생각의 연속성이 가능하다는 것을 6일 구글 시연영상에서 보여주었다고 한다.
제미나이의 기능으로는 질문에 대한 답변 생성, 창의적인 콘텐츠 작성, 언어 번역, 코드 생성, 다양한 종류의 창의적인 텍스트 형식 생성등이 가능하다 특별히 제미나이는 앞선 바드에 비해 추론 능력이 뛰어나다. 이미지와 오디오를 직접 이해할 수 있기 때문에, 텍스트만을 이해할 수 있는 기존의 LLM보다 복잡한 작업을 수행할 수 있다. 예를 들어, 수학, 과학, 엔지니어링 등과 관련된 작업, 데이터 분석, 머신 러닝 등과 관련된 작업, 다양한 데이터를 처리하는 작업 등의 일들을 처리할 수 있다. 아직 개발 초기 단계이지만, 다양한 분야에서 활용될 것으로 기대되고 있다.
제미나이의 특징들로는 텍스트뿐 아니라 이미지 오디오들의 다양한 데이터로 학습이 가능하며, 학습방식에 있어서도 감독학습과 강화학습이 다 가능하다. 추론능력이 뛰어나고 데이터 처리능력이 뛰어나다. 복잡한 작업을 위한 용도로 사용할 수 있다. 크기는 울트라, 프로, 나노 세 가지로 나뉘어있다.
바드 VS. 제미나이 그리고 GPT 4
여기에서 제미나이에 앞서 우리가 이미 사용하고 있느 BARD와는 무슨 관계가 있을까 의문이 생긴다.
바드와 제미나이는 모두 구글에서 개발한 언어모델(LLM)이다.
공통적으로 바드와 제미나이는 모두 텍스트와 코드의 방대한 데이터 세트로 학습된 대규모 언어 모델이고 두 모델 모두 공통적으로 다음과 같은 기능을 수행할 수 있다.
질문에 대한 답변 생성, 창의적인 콘텐츠 작성. 언어 번역, 코드 생성, 다양한 종류의 창의적인 텍스트 형식 생성등이 둘 다 가능하다. 다만,두 모델은 위에 언급한 능력과 데이터 처리 능력, 용도, 크기 등의 측면에서 차이점이 있다.
바드는
제미나이보다 약 1년 정도 먼저 개발되었다. 2022년 1월에 출시되었으며, 텍스트와 코드의 방대한 데이터 세트로 학습되었다. 위에서 언급했듯이 바드는 질문에 대해 답변을 할 수 있고 창의적인 콘텐츠도 요청에 따라 만들 수 있다. 다른 언어로 번역이 가능하고 코드도 생성할 수 있다 또 다양한 종류의 창의적인 텍스트형식의 생성능력도 있다. 이런 BARD는 고객 서비스나 교육, 일부 창의적인 작업 및 연구 개발등에 이미 사용되고 있다. 바드와 제미나이 와의 차이점이라면 추론능력이다.. 바드는 제미나이에.. 비해 데이터 처리 사이즈가 한계가 있다. 제미나이는 수학 문제의 답을 구하거나, 틀린 추론 과정을 지적, 분석할 수 있지만 바드는 그렇지 못하다.
BARD와 GEMINI의 일반적인 공통점
특징 | 바드 | 제미나이 |
학습 데이터 | 텍스트와 코드 | 텍스트와 코드 |
기능 | 질문에 대한 답변 생성, 창의적인 콘텐츠 작성, 언어 번역, 코드 생성, 다양한 종류의 창의적인 텍스트 형식 생성 | 질문에 대한 답변 생성, 창의적인 콘텐츠 작성, 언어 번역, 코드 생성, 다양한 종류의 창의적인 텍스트 형식 생성 |
BARD와 GEMINI의 일반적인 차이점
특징 | 바드 | 제미나이 |
출시일 | 2022년 1월 | 2023년 12월 |
추론 능력 | 보통 | 뛰어남 |
데이터 처리 | 텍스트 | 텍스트, 이미지, 오디오 |
용도 | 다양한 작업 | 복잡한 작업 |
크기 | 하나 | 세 가지(울트라, 프로, 나노) |
위에 비교해 놓은 도표에서 알 수 있듯이 바드와 제미나이는 차이가 있다. 구체적으로 방식에 있어서 크게 두 가지로 요약할 수 있다.
-데이터 처리방식
바드는 텍스트만 처리할 수 있는 반면, 제미나이는 텍스트, 이미지, 오디오 등 다양한 데이터를 처리할 수 있다. 이는 제미나이가 Transformer라는 기술을 사용하여 데이터를 처리하기 때문이다. Transformer는 자연어 처리 분야에서 가장 널리 사용되는 기술 중 하나로, 복잡한 관계를 가진 데이터를 효율적으로 처리할 수 있다.
- 학습방식
바드는 텍스트와 코드의 방대한 데이터 세트로 학습되지만, 제미나이는 멀티모달 학습을 통해 다양한 데이터를 처리할 수 있기 때문에 텍스트와 코드의 데이터 세트 외에도 이미지와 오디오의 데이터 세트로 학습된다. 멀티모달 학습은 서로 다른 종류의 데이터를 결합하여 학습하는 방식으로, 다양한 데이터를 처리하는 데 필요한 추론 능력을 향상시킬 수 있습니다.
BARD와 GEMINI의 구체적인 방식의 차이점
특징 | 바드 | 제미나이 |
데이터 처리 방식 | 텍스트 | 텍스트, 이미지, 오디오 |
학습 방식 | 텍스트와 코드 | 텍스트와 코드, 이미지, 오디오 |
사용하는 기술 | RNN | Transformer |
학습 데이터 | 텍스트와 코드 | 텍스트와 코드, 이미지, 오디오 |
학습 방법 | 감독 학습 | 감독 학습, 강화 학습 |
바드와 제미나이는 모두 계속해서 사용될 것으로 예상된다. 바드는 이미 다양한 분야에서 활용되고 있으며, 제미나이는 출시된 지 얼마 되지 않았지만, 그 잠재력이 충분히 인정받아서 앞으로 더욱 폭넓게 활용될 것으로 기대되기 때문이다.
구글은 바드와 제미나이를 지속적으로 업데이트하고 개선할 예정이라고 한다. 바드에 대해 추론 능력, 데이터 처리 능력, 유연성 등을 향상하려고 할 계획이라고 한다.
바드의 장점도 분명 있다.. 제미나이보다 추론 능력이 떨어지지만, 데이터 처리 능력이 뛰어나고, 용도가 다양하며, 크기가 하나로 단순하다 데이터 처리가 많은 작업-대규모 텍스트 데이터의 분석이나 다양한 용도로 사용이 필요한 작업-다양한 언어의 번역, 다양한 종류의 창의적인 텍스트 형식의 생성, 모바일 디바이스에서 실행이 필요한 작업[VL1] -모바일 앱에서의 사용자 인터페이스 구현 등에 뛰어난 능력을 보인다.
물론 바드에 제미나이의 능력을 추가하면 제미나이보다 더 뛰어난 모델이 될 수 있지 않을까 싶지만 제미나이의 능력은 바드와는 완전히 다른 방식으로 구현되어 있기 때문에 바드에 제미나이의 능력을 추가하는 것은 쉽지 않다고 한다. 만약 바드에 제미나이의 능력을 추가하려면 바드의 크기와 복잡성이 증가하는 등 두 모델의 코드를 근본적으로 재설계해야 할 수도 있다고 한다.
BARD와 GEMINI, GPT-4 차이점과 공통점
공통점
바드, 제미나이, GPT-4는 모두 대규모 언어 모델(LLM)로, 텍스트와 코드의 방대한 데이터 세트로 학습되었다. 따라서 세 모델 모두 다음과 같은 기능을 수행할 수 있다.
- 모두 대규모 언어 모델
- 모두 텍스트와 코드의 방대한 데이터 세트로 학습
- 모두 다음과 같은 기능을 수행할 수 있음
차이점
제조사
- 바드: 구글
- 제미나이: 구글
- GPT-4: 오픈AI
출시일
- 바드: 2022년 1월
- 제미나이: 2023년 12월
- GPT-4: 2022년 3월
데이터 세트
- 바드: 텍스트와 코드
- 제미나이: 텍스트, 이미지, 오디오
- GPT-4: 텍스트
학습 방식
- 바드: 감독 학습
- 제미나이: 감독 학습, 강화 학습
- GPT-4: 감독 학습
추론 능력
- 바드: 보통
- 제미나이: 뛰어남
- GPT-4: 보통
데이터 처리 능력
- 바드: 텍스트
- 제미나이: 텍스트, 이미지, 오디오
- GPT-4: 텍스트
용도
- 바드: 다양한 작업
- 제미나이: 복잡한 작업
- GPT-4: 다양한 작업
크기
- 바드: 하나
- 제미나이: 세 가지(울트라, 프로, 나노)
- GPT-4: 하나
전반적으로 제미나이는 바드와 GPT-4보다 추론 능력이 뛰어나다고 구글은 주장한다.
GENIMI에 대한 비판
첫 번째는, 제미나이가 추론 능력이 뛰어나다고는 하지만, 실제로는 기존의 LLM과 큰 차이가 없다는 비판이다. 제미나이는 이미지와 오디오를 이해할 수 있지만, 아직까지는 텍스트를 이해하는 능력이 더 뛰어나다는 것이다. 따라서, 제미나이는 수학, 과학, 엔지니어링 등과 관련된 작업이나 데이터 분석, 머신 러닝 등과 관련된 작업에는 적합하지만, 창의적인 콘텐츠 작성이나 고객 서비스 등과 관련된 작업에는 기존의 LLM과 큰 차이가 없다는 것이다.
두 번째는, 제미나이가 아직 개발 초기 단계이기 때문에, 안정성이나 성능이 떨어진다는 비판이 있다. 제미나이는 아직까지 많은 데이터 세트로 학습되지 않았기 때문에, 때때로 오류를 범하거나, 예상치 못한 결과를 생성하기도 한다. 따라서, 제미나이는 아직까지는 실무에서 사용하기에는 무리가 있다는 것이다.
개인적으로는, 제미나이는 아직 개발 초기 단계이기 때문에, 이러한 비판은 어느 정도 예상할 수 있었다고 생각된다. 제미나이는 구글 AI의 AI 기술력이 집약된 제품으로, 앞으로 더욱 발전하여 다양한 분야에서 활용될 것으로 기대된다
'테크및 경제 이슈, 책 리뷰' 카테고리의 다른 글
2023년 12월 셋째 주 기준 경제 데이터( ECONOMIC DATA) (0) | 2023.12.19 |
---|---|
2023년 12월 둘째 주 기준 경제 데이터( ECONOMIC DATA) (0) | 2023.12.13 |
AI 동맹(AI Alliance) 설립 : META,IBM, NASA등 참여하다. (0) | 2023.12.08 |
투자에 임하는 우리의 자세 3 : 찰리 멍거의 3개의 QUOTES (0) | 2023.12.02 |
투자에 임하는 우리의 자세 2: 시대를 초월한 투자자들의 말 (2) | 2023.12.01 |