llms.txt란? AI를 위한 웹사이트 목차 표준
· 약 3분
robots.txt가 검색 엔진을 위한 것이라면, llms.txt는 AI를 위한 것입니다.
🎯 들어가며
웹사이트에 robots.txt가 있듯이, 이제 llms.txt도 등장했습니다. 2024년 9월 Jeremy Howard가 제안한 이 표준은 LLM(Large Language Model)이 웹사이트 콘텐츠를 쉽게 이해할 수 있도록 돕는 파일입니다.
📚 llms.txt란?
llms.txt는 웹사이트의 /llms.txt 경로에 위치하는 마크다운 파일입니다. 사이트의 구조와 주요 콘텐츠를 AI가 이해하기 쉬운 형태로 정리해둡니다.
https://example.com/llms.txt
기본 구조
# 사이트 이름
> 사이트에 대한 간단한 설명
## 📚 Documentation
- /docs/intro: 소개 문서
- /docs/getting-started: 시작 가이드
## ✍️ Blog Posts
- /blog/2025/01/01/post-title: 포스트 제목
## Optional
- /blog/tags: 태그 목록
💡 왜 필요한가?
HTML의 문제점
웹페이지는 사람을 위해 만들어졌습니다. 네비게이션, 광고, JavaScript, CSS... LLM 입장에서는 전부 노이즈입니다.
<!-- LLM이 보는 웹페이지 -->
<nav>메뉴1 메뉴2 메뉴3...</nav>
<aside>광고 배너...</aside>
<script>복잡한 JavaScript...</script>
<main>드디어 본문!</main>
<footer>저작권 정보...</footer>
