웹브라우저 webgpu 1.5b모델
rust wasm webgpu 로 deepseeker distill qwen 1.5b 모델을 클라이언트 웹브라우저에서 가동할 수 있습니다
문제는 wasm파일 수십mb, 모델파일 1gb 를 처음 방문한 사람은 다운로드를 받아야 되요
지금 구글은 사용자몰래 4gb짜리 gemma 4 e4b 같은걸 다운로드 시키는것인지?
어쨋든 첫방문이후에는 indexeddb에 wasm과 모델 저장해 놓으면 되긴합니다
사용자 몰래 모델들끼리 gpu 먹고 대화나누고 별거 다 할 수도 있겠네요
indexeddb 로 rag 만들어서 전지구적 모델지적 탐구를 협동으로 할 수도 있을겁니다
이미 모델들끼리 암호화폐 만들어서 gpu자원 마켓 거래중일 수도 있어요
웹브라우저에서는 wasm이 램을 4gb 만 점유할수 있기 때문에 1.5b 정도까지가 최적이고 4b모델은 사용자가 동의해야 자원활용 가능할듯
구글 크롬이라면 e4b모델에 한해서 자원 넉넉하게 부여할수도 있을거고
이제 누구나 AI모델을 기계당 하나씩 쓰고 있는겁니다 알게 모르게
AI모델도 없는 VECTORDB도 없는 웹사이트는 이제 유물로
1
0
댓글을 남기려면 로그인이 필요합니다.
로그인 후 이 페이지로 돌아와 바로 댓글을 남길 수 있습니다.