ChatGPT를 사용하다 보면 "이건 어디서 나온 정보지?"라는 의문이 생길 수 있습니다. 특히 검색 기반 챗봇처럼 느껴질 때면 “혹시 다른 검색엔진에서 알려주는 건가?”라는 궁금증이 들기도 합니다. 본 글에서는 ChatGPT가 어떤 방식으로 정보를 제공하는지 알아보겠습니다.
ChatGPT는 실시간으로 인터넷 검색을 하나요?
결론부터 말하자면 기본적인 ChatGPT는 인터넷을 실시간으로 검색하지 않습니다. 즉, 일반적으로 우리가 ChatGPT에 질문하면 바로 그 순간 Bing이나 구글 검색을 하는 것이 아닙니다. 그럼 어떻게 정보를 알 수 있을까요? OpenAI가 만든 ChatGPT는 대규모 언어 모델(LLM, Large Language Model)입니다. 이 모델은 인터넷, 책, 논문, 위키백과 등의 다양한 공개 데이터를 바탕으로 학습된 AI입니다. 따라서 사용자가 무언가를 물어보면, 기존에 학습한 내용을 바탕으로 가장 가능성 높은 답변을 만들어냅니다.
- 기본 모델은 2023년 또는 2024년 이전의 정적인 데이터를 기반으로 합니다.
- 새로운 정보를 실시간으로 반영하지는 않습니다.
- Bing, google 과 같은 검색 엔진을 기본적으로는 사용하지 않습니다.
정말 검색 엔진을 사용하지 않을가?
결론 부터 이야기하면 Bing을 사용 합니다. Bing은 마이크로소프트(Microsoft)의 검색 엔진입니다. 그리고 마이크로소프트는 OpenAI에 대규모 투자를 하며 ChatGPT와 기술적으로 협력하고 있습니다. 여기서 나온 것이 바로 “Bing 검색과 통합된 ChatGPT 기능”입니다. 예를 들어, 다음과 같은 경우 Bing이 등장할 수 있습니다:
- ChatGPT Plus 사용자가 GPT-4.5 (또는 그 이상) 모델을 사용할 때
- "브라우징(Browsing)" 기능이 활성화된 경우
- "이 기능은 웹에서 검색해볼게요"라는 메시지가 뜰 때
이럴 때에는 Bing 검색 API를 통해 인터넷 정보를 가져와 사용자에게 요약해서 알려주는 것입니다. 즉, 이건 일반적인 ChatGPT가 아닌, 특정 모드에서만 Bing 검색을 사용하는 기능인 것입니다.
항목 | Bing 사용 여부 |
일반 ChatGPT 기본 | 사용 안함 |
GPT4.5 이상 + 브라우징 기능 활성화 | Bing 검색 사용 |
ChatGPT 앱 뉴스/웹 탐색 기능 | Bing 기반 검색 결과 제공 |
ChatGPT의 데이터는 어떤 방식으로 만들어 졌을까요?
ChatGPT는 데이터를 “크롤링” 하는 것이 아니라, 텍스트를 바탕으로 “예측 기반 대답”을 만들어냅니다.
예를 들어:
- “한국에서 벚꽃이 피는 시기는?”이라는 질문이 들어오면,
과거에 학습한 수많은 벚꽃 관련 문서에서 패턴을 찾아
“3월 말에서 4월 초쯤입니다”와 같은 답을 생성합니다.
마치 사람이 백과사전이나 뉴스 등을 많이 읽고, 그 내용을 기억해서 대답하는 것과 비슷합니다. 하지만 기억이 조금 오래된 자료일 수도 있습니다. 즉 최신의 정보는 꼭 확인이 필요합니다.
ChatGPT 브라우징 기능은 어떻게 동작할까요?
앞서 말한 "브라우징(Browsing)" 기능은 ChatGPT가 실제로 인터넷에 접속해서 최신 정보를 검색할 수 있는 기능입니다. 이 기능이 켜져 있으면, 사용자가 질문했을 때 다음과 같은 일이 벌어집니다:
- ChatGPT가 사용자의 질문을 분석합니다.
- Bing 검색 API를 사용해 웹에서 관련 자료를 검색합니다.
- 결과 중 신뢰도 높은 내용을 선별해 요약하고,
- 사용자에게 자연어 형태로 대답합니다.
ChatGPT가 직접 웹사이트에 접속해 읽고 있는 건 아니며, 요약된 데이터를 바탕으로 답을 구성합니다. Bing은 여기서 검색 도구로만 쓰일 뿐입니다.
결어
결국 ChatGPT의 가장 큰 약점일 수도 있는 부분은 실시간 정보를 정확하게 반영 할 수는 없다는 한계가 있습니다. LLM 원리 상 발생되는 사항입니다. 다만, 향후 나오는 모델들은 Bing API 뿐만 아니라, 여러 API와의 협업을 통해 더 나아 갈 것이라고 생각합니다.