자갈돌의 devLog

Codex에 Multi Agent 기능 추가

2026.03.05 1 분 소요

Claude Code에만 있던 Sub Agent(서브 에이전트) 기능이 OpenAI Codex에도 공식 추가되었다.

중국 모델들의 Claude 불법 증류 사건

2026.03.05 2 분 소요

2월 23일, Anthropic이 공식 블로그를 통해 중국 AI 연구소 3곳의 대규모 증류 공격 정황을 공개했다.

2026년 2월 AI 모델 릴리즈 총정리

2026.03.04 3 분 소요

2월 한 달간 AI 업계에서는 주요 기업들이 동시다발적으로 새 모델을 쏟아냈다. Opus 4.6의 SOTA 달성으로 시작해 Gemini 3.1 Pro의 SOTA 탈환으로 마무리된 한 달을 출시 순서대로 정리해본다.

[Review] Qwen2.5-Omni Technical Report

2026.03.01 4 분 소요

Qwen2.5-VL을 정리한 뒤, 오디오까지 함께 다루는 모델이 어떻게 구성되는지 궁금해서 Qwen2.5-Omni Technical Report를 중심으로 스터디 내용을 정리했다.

[Review] Qwen2.5-VL Technical Report

2026.02.03 4 분 소요

요즘 AI 서비스들은 대부분 이미지 인식 기능을 탑재하고 있다. 과연 이런 멀티모달 VLM은 실제로 어떤 모델 구조를 가지고 있을까?

[Review] Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity

2026.02.02 2 분 소요

똑같은 말만 하던 LLM에게 다양한 대답을 얻는 방법이 있다고한다. 훈련 없이, 오직 프롬프트만으로 다양성을 끌어올리는 접근이다.

[Review] VL-JEPA: Joint Embedding Predictive Architecture for Vision-language

2026.02.01 3 분 소요

저번에 소개한 JEPA 계열의 최신 논문, Vision-Language JEPA다. 월드 모델(world model) 관점에서 보았을 때 충분히 경쟁력 있는 비전‑언어 아키텍처로 보인다.

[Review] I-JEPA:Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture

2026.01.31 2 분 소요

Meta의 얀 르쿤은 LLM(생성형 모델)만으로는 AGI에 도달하기 어렵다고 보고, 생성 중심 패러다임을 넘어 월드 모델을 연구하고 있다. 그 흐름 속에서 VL-JEPA, V-JEPA 등이 등장했고, I-JEPA는 JEPA 시리즈의 시작점이 되는 이미지 자기지도 학습 논문이다.

[Review] Don’t Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasks

2026.01.29 3 분 소요

이 논문은 “RAG 대신 CAG를 쓰자”는 주장이다. (Retrieval → Cache) 핵심은 KV Cache 재활용이다.

[Zotero] Cite Preview Resizer 플러그인을 만들며

2025.09.27 3 분 소요

Zotero 7 PDF 리더에서 인용이나 주석 위에 마우스를 올리면 작게 뜨는 미리보기 팝업 때문에 늘 고생했다. 글자가 너무 작아서 참고문헌을 확인하려면 결국 팝업을 클릭해서 본문으로 이동하거나, 눈을 찌푸려가며 겨우 읽어야 했다. 놀랍게도 Zotero에는 이 팝업 크기를 조절하...

[Review] Reflexion: Language Agents with Verbal Reinforcement Learning

2025.08.23 4 분 소요

Reflexion은 2023년 10월에 나온 논문으로, LLM이 시행착오로부터 스스로 피드백을 생성하고 개선할 수 있는 프레임워크이다.

[프로젝트 회고] MaeilMail - 일간 메일 보고서 비서 (Naver boostcamp)

2025.07.29 6 분 소요

더 이상 미룰 수 없었던 매일메일 프로젝트에 대한 회고를 남긴다. 나는 단순한 챗봇이 아니라, 정말 사람들에게 실질적인 도움을 줄 수 있는 LLM 기반 서비스를 만들고 싶었다. 그 방향성 아래, 우리 팀은 하루 동안 받은 이메일을 요약 및 정리해주는 LLM Agent 시스템을 기획...

Hyejun An(26)

최근 포스트