벌봄
209
2022-06-23 16:09:56 작성 2022-06-23 16:10:42 수정됨
2
492

db utf8mb4 인코딩 방식을 사용했을 때 utf8 에 비해 성능이 떨어지지는 않을까요?


현재 만들고 있는 사이트가(포트폴리오에요) 유저 입장에서 영상/날짜/지역만 업로드 하는 사이트여서 이모지가 딱히 필요없을 거 같고 utf-8이 성능이 좋을 거 같아서 utf-8 인코딩방식을 채택하려고 해요. 그런데 이에 대해 명확한 근거를 찾고 싶어서 검색을 해봤는데 이에 대한 내용을 찾기 힘들더라고요 ㅠ utf-8 이랑 utf8mb4 인코딩 방식이랑 성능 차이는 없을까요? 

0
  • 댓글 2

  • 캐티
    6k
    2022-06-23 16:16:54

    왜 그렇게 생각하시나요.

    utf8 은 utf8mb3 와 utf8mb4 로 나눠지빈다. 이것은 최대 길이 3바이트이거나 최대 길이 4바이트로 코덱의 지원 스펙이 다른 것이어여.

    utf8mb4는 이모지 관련한 로직이 들어 있을 것이빈다.

    utf8mb3랑 utf8mb4에 ascii(7비트) 문자만 넣게 되면 둘의 데이터는 같은 것이 들어갈 것이빈다.

    MySQL :: MySQL 8.0 Reference Manual :: 10.9.2 The utf8mb3 Character Set (3-Byte UTF-8 Unicode Encoding)

    MySQL :: MySQL 8.0 Reference Manual :: 10.9.1 The utf8mb4 Character Set (4-Byte UTF-8 Unicode Encoding)

  • 벌봄
    209
    2022-06-23 16:31:07

    아 그렇군요!! utf8mb3/utf8mb4가 utf-8이랑 문자셋이 같다는 걸 모르고 별도의 문자셋이 있을거라고 생각했어요. 유니코드 문자셋에 이모지까지 문자셋에 추가 된다고 생각했습니다. '더 많은 경우의 수와 대조를 하니까 성능이 더 떨어지지 않을까?' 라는 생각을 했습니다. 다음부터 공식 문서 확인해보고 질문 글 올리겠습니다 감사합니다.

  • 로그인을 하시면 댓글을 등록할 수 있습니다.