[뉴스] AI 콧대 꺾은 인류 마지막 시험…韓 연구자 8명 출제·평가자 참여

Reference by 한국경제 AI 기술이 비약적으로 발전하며, 오늘날에는 만점에 가까운 성적을 기록하는 모델들이 속속 등장하고 있습니다. 그러나 이러한 성과 뒤에는 여전히 해결되지 않은 문제들이 숱하게 남아 있는데요. 바로, 인류 차원에서 출제된 ‘인류의 마지막 시험(Humanity’s Last Exam·HLE)’이 그것입니다. AI 콧대 꺾은 인류 마지막 시험…韓 연구자 8명 출제·평가자 참여라는 흥미로운 사실은 이 시험이 단순한 벤치마크를 넘어, AI […]

2025년 최신 LLM 평가 혁신, Amazon Nova LLM-as-a-Judge 핵심 기술과 전망

Created by AI 어떻게 AI가 스스로를 평가하고 개선할 수 있을까? 2025년 7월, AWS가 선보인 Amazon Nova LLM-as-a-Judge가 AI 평가 방식의 판도를 바꾸고 있습니다. 이 혁신적인 기술은 생성형 AI 모델의 평가 프로세스를 자동화하고 객관화하여, AI 개발의 효율성과 신뢰성을 한 단계 끌어올렸습니다. LLM 평가의 새로운 패러다임 Amazon Nova LLM-as-a-Judge는 기존의 주관적인 인간 평가 방식에서 벗어나, AI가 AI를 […]

Begin typing your search term above and press enter to search. Press ESC to cancel.

Back To Top