안녕하세요, 도커로 워드프레스 배포하기 글 이후 오랜만입니다!! 오늘은 Azure와 ChatGPT 주제로 돌아왔습니다. 정말 재미있게 읽은 책입니다. Azure OpenAI 과연 무엇일까요? 같이 알아봅시다.
감사하게도 제이펍 서평단에 당첨되어 도서를 지원 받았습니다!! 제이펍 관계자 분 감사 감사 드립니다! (꾸벅)
지금부터 제가 책에 대한 전반적인 느낌과 장점 등을 공유하려고 합니다.
이 글을 읽으시는 분들은 대부분 IT 쪽에 관심이 많으신 분들이라고 생각합니다. Azure, ChatGPT 등은 사실 IT 쪽이 아니더라도 들어보셨을 수도 있습니다!
먼저, 책 소개 멘트를 함께 확인해볼까요?
빠르게 발전하는 AI 기술의 중심에는 마이크로소프트 Azure OpenAI가 있다. 이 책은 실무에서 바로 활용할 수 있도록 생성형 AI와 ChatGPT 모델의 도입부터 최적화까지 단계별로 안내하는 실전 가이드다. 애저에서 ChatGPT 기반 RAG를 활용한 사내 문서 검색 시스템과 LLM을 탑재한 코파일럿 애플리케이션을 구축하면서 이론뿐만 아니라 실제 적용 방법까지 배울 수 있다. Azure OpenAI 활용에 필요한 거버넌스와 책임 있는 AI 구현도 함께 다룬다. 이 책을 통해 AI 시스템을 쉽게 구축하고, 업무에 바로 적용할 수 있는 유용한 기술과 노하우를 배울 수 있을 것이다.
본격적인 책 소개 전에 먼저 Azure, OpenAI, ChatGPT에 대해서 간단하게 소개 드리겠습니다.
Azure는 아주르 또는 애저라고 불리는 MicroSoft에서 제공하는 클라우드 플랫폼입니다. 서버, 데이터베이스, AI, 스토리지, 네트워크 등을 클라우드에서 제공하는 서비스입니다.
OpenAI는 인공지능(AI) 연구 및 개발을 하는 회사로 ChatGPT와 Dall-e 등을 개발하였습니다. ChatGPT로 인공지능 서비스로 전 세계적으로 AI 돌풍을 일으켰습니다.
ChatGPT는 OpenAI에서 만든 대화용 인공지능 챗봇으로 사람처럼 자연스럽게 대화할 수 있고 질문에 답을 하고 글을 생성하는데 특화된 AI입니다.
자, 이제 Azure, OpenAI, ChatGPT가 무엇인지 간단하게 알았으니, 본격적으로 리뷰를 시작해보겠습니다.

먼저, 책 디자인이 너무 이쁩니다!!!!! Azure 이미지가 확 떠오르고 빨리 읽고 싶다는 생각밖에 안 들었습니다. 정말 디자인부터 눈길을 잡았습니다(표지 디자인부터 책 내부 디자인도 깔끔하고 좋았습니다).
이 책은 책 표지에서 확인할 수 있듯이 클라우드에서 OpenAI 서비스로 ChatGPT를 만들어보면서 LLM 시스템에 대해서 이해하기에 좋습니다.
개인적으로 전공자 또는 현업에서 일하시는 분들도 편하게 개념을 재 정립하고 LLM 관련 프로젝트에서 프로토타입을 만들 때 활용하기 좋다고 생각하고 비 전공자이거나 IT 쪽을 잘 모르시더라도, Chatgpt의 구성 요소 등을 알아보기에는 충분합니다.
먼저, 간단하게 제 경험을 말씀드리자면, 저는 작년에 진행한 프로젝트에서 챗봇을 개발했어야 했는데, 그 때, Azure와 OpenAI를 동시에 사용했습니다.
OpenAI에서 제공하는 API가 트래픽이 몰릴 때, 정상 작동이 안되는 것을 발견하고, Azure에서 OpenAI 모델을 서빙 받아서 API Server를 구축해서 사용했는데, 가동률이 정말 좋았습니다.
그 이후로는 OpenAI API를 사용하기보다는 Azure OpenAI 서비스를 사용해서 언어 모델에 대한 REST API를 구축해서 쓰고 있습니다. 가동률이 좋다 보니 안전하게 사용하고 있습니다.
다시 책 내용으로 돌아가 볼까요?
개인적으로 IT 관련 특히, 기술 관련 서적은 가장 중요한 포인트가 “얼마나 쉽게” 설명하는가? 입니다. 이러한 관점에서 봤을 때, 본 서적은 100점 만점에 100점을 주고 싶습니다.


간단하게 제가 중요하다고 생각한 부분을 소개해드리겠습니다.
- 생성형 AI와 ChatGPT에 대한 소개입니다. ChatGPT, 즉 LLM(대규모 언어 모델)이자 생성형 모델에 대해 다룹니다. 요즘 많은 사람들이 생성형 모델의 본질을 잘 모르고 접근한다고 생각합니다. 간단히 말하면, 언어 모델은 본질적으로 확률 모델입니다. 예를 들어, x라는 데이터가 입력되었을 때 y가 80%, z가 70%의 확률로 도출된다면 y가 출력으로 나오는 식이죠.
생성형 모델에서 가장 큰 문제 중 하나는 바로 ‘환각(hallucination)’ 현상입니다. 왜 환각 문제가 발생할까요? 앞서 설명했듯이, 글자들이 확률에 기반해 생성되기 때문입니다. 언어 모델은 방대한 데이터를 통해 학습하는데, 만약 학습 데이터에 포함되지 않은 질문을 받으면 LLM은 자신이 가진 데이터에서 그럴듯한 답변을 만들어내려고 합니다.
GPT-3.5, GPT-4, GPT-4o처럼 모델이 발전해온 과정을 통해 여러 LLM을 사용해본 분이라면 이런 변화를 느끼셨을 겁니다. 처음에는 “이 모델 좀 멍청하다” 싶다가도, 점점 “얘가 똑똑해지고 있네?”라는 생각이 들죠. 이는 학습 데이터의 양이 늘어나고 최신 데이터를 반영하면서, 과거 모델이 그럴듯한 오답을 생성했던 것에 비해 점점 더 정확한 답변을 내놓게 되는 결과입니다.
책에서는 ‘스케일링의 법칙(Laws of Scaling)’을 설명하는데, 이런 디테일한 부분이 정말 마음에 들었습니다. 이 가설은 학습 데이터의 양, 파라미터 수, 컴퓨팅 리소스가 멱법칙(power law)에 따라 결정된다는 것으로, 쉽게 말해 이 세 가지 요소가 커질수록 모델 성능이 무한히 향상될 가능성이 있다는 뜻입니다.
또한 RLHF(인간 피드백을 통한 강화학습)나 얼라인먼트(alignment)에 대한 설명도 포함되어 있어 놀라웠습니다. 대부분의 책이 이 개념들을 다루긴 하지만, 왜 이런 요소가 중요한지, 그리고 어떻게 언어 모델(GPT)을 업그레이드하는지에 대해 그림과 함께 쉽게 풀어주는 경우는 드뭅니다. 이 책은 그 점에서 정말 자연스럽고 이해하기 쉽게 설명되어 있습니다. - 프롬프트 엔지니어링
프롬프트 엔지니어링에 대한 설명과 CoT(Chain of Thought)에 대한 설명이 있습니다. 파인튜닝이나 RAG 시스템을 구축할 수 있으나, 컴퓨터에 익숙하지 않고, 코딩을 잘 모른다면 어렵습니다. 따라서 일반 사용자는 프롬프트 엔지니어링을 통해서 최적의 결과를 얻어야 하며 왜 “프롬프트 엔지니어링”이 중요한 지 자세하게 설명되어 있습니다.
참고로, 최근 DeepSeek R1이 핫한 토픽으로 떠올랐죠? R1이 CoT 기법이 적용된 부분도 영향이 있다고 합니다. - Rag 개요 및 설계
Chatgpt의 문제는 과거 데이터를 기반으로 데이터를 생성하기에 최신 정보를 포함하지 않는 문제가 있으며 이를 해결하기 위해서 모델을 지속적으로 학습한다면 천문학적인 비용이 발생하게 됩니다.
따라서 최신 데이터를 참고할 수 있도록 RAG(Retrieval-Augmented Generation) 기법을 사용합니다. 쉽게 설명드리면, 구글링 해서 최신 정보에 기반해서 LLM이 Generation 한다고 생각하시면 됩니다.

아, 그리고 책 중간 중간에 개념에 대한 설명이 정말 잘 되어 있습니다. RAG 시스템에서 색인 엔진이나, 원리 등에 대해서 줄 글이 아니라, 이미지와 함께 설명하니까 이해하기에 어려움이 없었습니다. 정말 편하게 읽혀지는 책입니다.

Azure OpenAI로 ChatGPT와 LLM 시스템 쉽고 빠르게 구축하기라는 책을 통해서 쉽고 빠르게 Azure에 기반한 ChatGPT 서비스를 구현해 보았습니다.
블로그로 담기에는 내용이 너무 많고, 아무래도 실습 쪽이 많다 보니까 모든 걸 다 풀어서 설명하기가 어려워서 아쉽습니다. 그래서! 꼭 한번 쯤은 읽어보시고 천천히 따라 해보시길 강추 드립니다.
정말 쉽고 잘 짜여 있는 책이라서 어려움 없이 나만의 “챗봇”도 만들 수 있고, 검색 기반 LLM도 만들 수 있습니다. 이러한 과정을 통해서 LLM과 관련된 시스템을 바라보는 힘이 길러진다고 생각합니다.
우리 모두, LLM가 친숙하게 되는 그 날까지 화이팅 합시다.
지금까지 Gil-IT 이었습니다.
감사합니다.