axolotl 훈련한 결과와 일반 코드로 훈련한 결과가 다르다.

axolotl 훈련한 결과와 일반 코드로 훈련한 결과가 다르다.

2024. 4. 1. 14:13ㆍ인공지능

알파카 형식의 데이터셋을 훈련 방법은 코드 베이스로 쥬피터 노트북으로 훈련하는 방법과 아홀로틀 훈련하는 방법이 있습니다.

이브이를 만든 야놀자에서도 아홀로틀을 사용할 정도로 쓸만한 훈련 툴이라고 생각이 되는데 어째서인지 5에폭 훈련을 시켰는데도 불구하고 데이터셋(약 700항목) 내용을 전혀 못 뱉어내는 결과가 나왔습니다.

이미 이브이 기반으로 쿠루가이 모델을 이걸로 훈련 시켰는데 뭥미(?)!!!!

몇 번을 해봐도 동일한 결과가 나왔습니다. 뭐가 문제지? 혹시나 하는 마음에 코드베이스로 5에폭 훈련 시켜보았습니다. 결과를 봤는데....아주 잘 훈련이 된것을 확인 할 수 있었습니다. 뭐지...똑같은 로라 하이퍼파라미터로 훈련했는데 결과가 전혀 다른건 도저히 이해할 수 없는 노릇이였습니다.

아홀로틀 전처리 하는 부분이 있는데 이 곳에서 중복된 데이터는 제거하는 기능을 수행한다는것을 알았습니다.

매뉴얼 기반으로 데이터셋을 만들었는데 중복된 용어들이 있어서 아마도 이 부분이 삭제되어 제대로 훈련이 안됐다고 가설을 세웠습니다. 오늘 집에가서 데이터 전처리 부분은 생략하고 다시한번 로라로 훈련해서 결과를 봐야겠습니다.

여기서 중복제거는 반드시 필요한 기능은 맞습니다. 하지만 특정 분야에서 사용하는 용어와 내용은 반복되는것이 많은데 이걸 제거해버리면....결국 훈련할게 없어져버립니다. 광범위한 데이터셋이라면 중복제거가 맞아요.

'인공지능' 카테고리의 다른 글

LLM 돌리기엔 RTX8000이 적절할까? (0)	2025.02.22
LLama-CPP-PYTHON에서 DeepSeek-R1-Distill-Qwen-32B 로드시 토크나이저 문제 발생! (1)	2025.01.31
미니PC에 gpu 연결해서 LLM 운영하기 (5)	2024.09.03
AI 말평 경진대회 - 대화 맥락 추론(가 유형)에 참가중 (0)	2024.07.04
RTX 8000으로 Axolotl 훈련 시 꼭 변경해야되는 설정 (0)	2024.03.09
axolotl 훈련 중 정보 해석하기 (0)	2024.03.02
speculative decoding에대해서 (0)	2024.02.26
우바부가가 OPENAI 형식으로 통신이 가능하네요. (1)	2024.02.06

Verification

Verification

태그

최근글

댓글

공지사항

아카이브

'인공지능' 카테고리의 다른 글

관련글

티스토리툴바