'A.I.(인공지능) & M.L.(머신러닝)/LLM' 카테고리의 글 목록

Private sLLM Polar는 이커머스, 조달 등 다양한 산업군에 적용이 가능 합니다.

1. Polar는 플래티어의 고유 sLLM 모델로, 이커머스의 고품질 데이터를 학습하여 설계되었습니다. 2. 특히, 내부 SCM체계에서의 재고, 단가, 협력사 정보등 민감정보를 안정하게 보호하며 Gen AI 기능을 제공이 가능합니다. 3. Polar는 임베딩 모델 및 벡터DB 제공을 통해 서비스시 정확한 정보제공이 가능 합니다. 4. ModernBERT를 기반으로 한국어 성능을 강화해, 한국어 텍스트의 잠재적 의미를 파악하는 고성능 임베딩 모델을 운영하고 있습니다. 도메인 업무 전반에 활용되며, 업무 효율과 공급자 고객 경험을 극대화하여 조달 산업 전반의 디지털 혁신을 이끄는 Use-Case는 하기 주소를 참조하시기 바랍니다. https://tech.x2bee.com/pag..

2025. 6. 20. 12:52 / 푸른 호수

A.I.(인공지능) & M.L.(머신러닝)/LLM

Beyond ‘Aha!’: Toward Systematic Meta-AbilitiesAlignment in Large Reasoning Models

최근 대규모 추론모델들이 많이 나왔습니다. 이들의 학습 과정(주로, 강화학습) 에서 long chainof-thought reasoning에 대한 잠재적 능력을 성장시킨다고 합니다. 강화학습 과정에서 자기 교정, 되짚기, 검증과 같은 고급 추론 행동들을 우연히 이끌어 낼 수 있다고 합니다. 이를 '아하' 순간이라고 합니다. 사실 이러한 아하 순간이 '우연히' 라는 단어에서도 알 수 있듯이 이것이 매우 예측 불가능하고 통제 불가능하기에 LRM(거대 추론 모델)의 추론 능력의 확장성과 신뢰성을 제한합니다. 그래서 해당 논문은 이를 자동으로 생성되고 자체 검증 가능한 작업을 사용하여 연역, 귀납, 가추라는 세 가지 메타 능력으로 모델을 명시적으로 정렬합니다. 이를 위해서 3단계 파이프라인(개별 정렬, 매개..

2025. 5. 28. 15:20 / Tech코알라

A.I.(인공지능) & M.L.(머신러닝)/LLM

HyperCLOVA X SEED 출시

안녕하세요. 이번에 네이버가 출시한 HyperCLOVA X SEED에 대해서 소개해보고자 합니다. 네이버가 이번에 HyperCLOVA X SEED를 출시하면서 "소버린 AI 생태계 구축을 위한 중요한 발걸음입니다. 소버린 AI의 구현은 어느 한 기업이나 국가가 혼자 이룰 수 없는 거대한 과제입니다. 네이버는 다른 기업들이 더 강력해지기를 바라며, 소버린 AI 생태계 조성을 위해 HyperCLOVA X SEED를 오픈소스로 공개합니다." 라는 말을 했는데 여기서 소버린 AI란 '자주적인', '주권이 있는' 이라는 의미의 소버린(Sovereign)에 AI(인공지능)을 붙인 단어로, 일반적으로, 특정 국가 또는 조직이 자국 내에서 독립적으로 운영하고 통제할 수 있는 인공지능 시스템을 의미합니다. 최근 여러 ..

2025. 4. 30. 09:09 / Tech코알라

A.I.(인공지능) & M.L.(머신러닝)/LLM

Nvidia의 새로운 LLM 파라미터 축소 방법론 : PUZZLE: DISTILLATION-BASED NAS FORINFERENCE-OPTIMIZED LLMS

이전에 NVIDIA Llama Nemotron Reasoning Models과 관련된 포스팅을 한적이 있습니다. NVIDIA Llama Nemotron Reasoning Models의 몇몇 학습 방법은 DeepSeek-R1 등과 같은 여타 다른 모델들의 학습 방법과 큰 차이가 존재하진 않습니다. 그러나 모델의 아키텍처는 차이가 있는데 그것이 바로 NAS(Neural Architecture Search) 입니다. NAS는 Arxiv에 게재되어 있는 PUZZLE: DISTILLATION-BASED NAS FOR INFERENCE-OPTIMIZED LLMS(Nvidia, 2025) 에서 제안된 커스터마이징 구조입니다. 그래서 이번 포스팅에서는 해당 논문을 리뷰해보고자 합니다. Large language m..

2025. 4. 11. 09:56 / Tech코알라

A.I.(인공지능) & M.L.(머신러닝)/LLM

R1 보다 성능 좋은 라마-3.1-네모트론-울트라-253B-v1 출시

안녕하세요 이번에 Nvidia 가 R1보다 성능이 좋다고 주장하는 모델인 라마-3.1-네모트론-울트라-253B-v1이 출시되었습니다. 해당 모델은 라마-3.1-405B-인스트럭트 모델을 기반으로 제작되었다고 합니다. Nvidia에서 작성한 출시 글을 보면, 이 모델을 제작하게 된 이유를 명확하게 작성하고 있는데요. 현재, AI의 발전은 Agent에 초점을 두고 이루어지는데요. 특히, 여러 기업들이 생산성 향상이라는 목표를 가지고 Agent를 앞다투어 개발하고 있습니다. AI 에이전트는 다양한 데이터 포인트와 동적 환경 속에서 발생하는 문제들을 해결하기 위해 고도의 추론 능력을 필요로 합니다. 또한 복잡한 시나리오에 대해 신속하고 논리적인 결정들을 내릴 수 있으며, 이를 통해 비즈니스의 민첩성과 전략적 ..

2025. 4. 11. 08:39 / Tech코알라

A.I.(인공지능) & M.L.(머신러닝)/LLM

딥시크 R2의 시작 : Inference-Time Scaling for Generalist Reward Modeling

딥시크 R1의 등장은 세상을 깜짝 놀라게 했는데요. 미국은 중국의 AI를 견제하기 위해서 고성능 칩들에 대한 수출을 통제하고 있던 중에 미국의 고성능 LLM 과 유사하거나 더 높은 성능의 모델을 세상에 내놓음으로써 사람들은 깜짝 놀랄 수 밖에 없었습니다. 그런, 딥시크가 이제는 R1의 후속으로 R2의 출시가 임박했다는 증거가 arXiv에 게재되었는데요 바로, Inference-Time Scaling for Generalist Reward Modeling 입니다. Reinforcement learning (RL) has been widely adopted in post-training for large language models (LLMs) at scale. Recently, the incentiv..

2025. 4. 8. 17:31 / Tech코알라