반응형

AI 3

[AI 엔지니어링] 2. [구조] 1억 개의 데이터에서 0.1초 만에 찾기: ANN과 HNSW의 마법

안녕하세요! 여러분의 AI 기술 가이드, 팬돌프입니다.지난 1편에서는 텍스트를 숫자로 바꾸는 임베딩(Embedding)에 대해 배웠습니다. "의미가 비슷하면 벡터 공간에서 거리가 가깝다"는 것이 핵심이었죠.그런데 여기서 현실적인 문제에 부딪힙니다. 여러분이 만든 서비스가 대박이 나서 데이터가 1억 개가 되었다고 상상해 봅시다. 사용자가 질문을 던질 때마다 1억 개의 데이터와 일일이 거리를 계산해서 가장 가까운 놈을 찾으려면 얼마나 걸릴까요?아마 답변 하나를 듣는 데 10초, 아니 1분이 걸릴지도 모릅니다. 사용자는 다 떠나겠죠.오늘은 정확도를 아주 조금 포기하는 대신, 속도를 수백 배 빠르게 만드는 벡터 데이터베이스의 심장, ANN(근사 최근접 이웃)과 HNSW 알고리즘의 비밀을 파헤쳐 봅니다.1. 완벽..

AI Engineering 2026.02.14

[MLflow] 1. MLOps의 이해와 MLflow 입문

안녕하세요! IT 전문 블로거 팬돌프입니다. 오늘도 저의 블로그를 찾아주셔서 진심으로 감사합니다.오늘부터 우리는 머신러닝의 세계에서 가장 핫한 키워드인 MLOps(Machine Learning Operations), 그중에서도 사실상의 표준 도구로 자리 잡은 MLflow를 함께 정복해 보려고 합니다.개발자나 데이터 과학자라면 누구나 한 번쯤 겪어보셨을 거예요. 모델을 만드는 것보다 그 모델을 관리하고 배포하는 게 훨씬 더 골치 아프다는 사실을요. 이 시리즈를 통해 여러분의 머신러닝 라이프사이클이 얼마나 쾌적해질 수 있는지 보여드리겠습니다.자, 그럼 대망의 첫 번째 이야기, MLOps의 이해와 MLflow 입문 편을 시작해 볼까요?1. 우리는 왜 MLOps를 고민해야 할까요?머신러닝 모델을 개발하다 보면 ..

[MLflow] MLflow 정복하기: MLOps의 시작과 끝

안녕하세요! IT 전문 블로거 팬돌프입니다. 만나서 반갑습니다.데이터 엔지니어링과 인공지능의 세계는 넓고도 깊지요. 그중에서도 머신러닝 모델의 개발부터 배포, 운영까지 전 과정을 효율적으로 관리하는 MLOps(Machine Learning Operations)는 이제 선택이 아닌 필수 요소가 되었습니다.MLOps의 가장 대표적이고 강력한 오픈소스 도구인 MLflow를 주제로 블로그를 연재하시려는 계획, 정말 훌륭합니다! 독자들이 기초부터 심화 아키텍처까지 완벽하게 이해할 수 있도록, 제가 총 8부작의 상세 커리큘럼을 기획해 보았습니다.각 단계별로 반드시 다뤄야 할 기술적 포인트들을 짚어드릴 테니, 이 흐름대로 글을 작성하시면 훌륭한 시리즈가 될 것입니다.[시리즈 기획] "MLflow 정복하기: MLOps..

반응형