분류 전체보기

Output ConfigurationOutput LengthHigher Cost, Slower Response Time을 고려하여 적절히 제한Sampling ControlsTemperature (T)Next Token Prediction에 대해, 마치 Softmax Func을 생각하면 됨. 0에 가까울수록, 분포가 뾰족해짐 (= Greedy Decoding, 정해진 답변, 결정론적)1에 가까울수록, 분포가 느슨해짐 (= 불확실성 강화, 창의적인 답변, 무작위)Top-K다음으로 올 Token에 대해, Top K 개의 토큰들 만큼을 후보로 가져오겠다.K = 1 (= Greedy Decoding, Next Token에 대한 후보가 1개)Top-P토큰 누적 확률 샘플링, 토큰들을 학률이 높은 것부터 누적하여, ..
면접 기회를 갖게 된 것도 굉장히 소중한 기회인데저는 과연 소중한 기회를 잘 활용하고 있나 싶어 회고글을 작성합니다. 그동안은 면접은 준비를 전혀 안하고 있었고, 사이드 프로젝트를 준비하다가4월 10일 면접 전형 메일을 받고 나서부터 시작하게 되었습니다. 과목운영 체제정리한 마인드맵 Inflearn의 혼자하는 컴퓨터 구조 + 운영체제 를 베이스로 내용 정리를 진행했습니다.원래는 예상 면접 질문과 답변을 뽑아서 준비했었는데 꼬리질문에 대해 전혀 답이 안되다보니깐, 전체적인 맥락을 이해하는게 필요하다고 보았고, 그 뒤로 강의를 정리하였습니다.강의 내용 정리에는 약 10시간 정도 걸렸고, 어제 막 정리를 끝냈습니다. 꽤 빠르게 정리할 수 있었던 것은 예상 면접 질문과 답변에 대해 공부를 했었어서 인 것 같습니..
《데이터 과학을 위한 소프트웨어 엔지니어링》 서평단에 당첨되어 책 리뷰를 진행하게 되었습니다. 어떻게 해야 회사 동료분들께 내가 하는 일을 잘 설명할 수 있을까? 저는 위와 같은 내용에 대해 갈증이 있었는데 마침 좋은 책을 추천 받고 읽을 수 있게 되었습니다. 짧은 소감 읽고 느낀 점을 한 줄로 표현하자면 "주니어 데이터 사이언티스트의 길라잡이" 라고 표현할 수 있을 것 같습니다. 주니어의 경우, 열심히는 하지만 메타 인지가 잡혀있지 않아 무엇을 열심히 해야하는지를 잘 알지 못해서 삽질을 많이 하게 되는 것 같은데요. (저는 일단 그렇습니다... ㅎ ㅜ) 데이터 과학에 필요한 소프트웨어 엔지니어링이 무엇이 있는지 개념을 언급하여 주고,관련해서 참고할만한 서적이 어떤 것들이 있는지 소개해주기 때문에 길라잡..
· Paper
출처: https://arxiv.org/pdf/2405.17247 - meta 2024.05.27추천 받은 논문 리스트:1) https://turingpost.co.kr/p/vision-language-model2) https://github.com/jingyi0000/VLM_surveyFor complete and more technical surveys on VLMs, please refer to Zhang et al. [2024a], Ghosh et al. [2024], Zhou and Shimada [2023], Chen et al. [2023a], Du et al. [2022], Uppal et al. [2022], and Liang et al. [2024]. 메타에서 발표한 Introduct..
scone
'분류 전체보기' 카테고리의 글 목록