iwantchicken
30
2021-09-13 12:08:51
2
106

자바스크립트 cheerio에서 태그가 없는 문자열을 가져오려면?


안녕하세요. cheerio를 사용해서 크롤링 하던 중 질문이 생겨서 여쭤봅니다.

태그가 없는 문자열 같은 경우는 선택자를 어떻게 해야할까요?


<strong>제목</strong>
내용 어쩌구저쩌구어쩌구저쩌구

<strong>제목2</strong>
내용 어쩌구저쩌구어쩌구저쩌구


크롤링 하려는 사이트 코드가 대략 이렇게 되어있는데, 제목같은 경우는


const $ = cheerio.load(html.data);
const list = [];

const selector = $(
    'strong'
);

selector.each(function(i, elem) {
    list[i] = {
        title: $(this).text(),
    };
}


이렇게 크롤링 하면 잘 작동되는데,

제목이 아닌 내용을 크롤링할때는 cheerio에서 어떻게 가져와야하는지 잘 모르겠습니다.

0
  • 답변 2

  • gandhi
    102
    2021-09-13 13:04:24

    list.push({ "strong" : $(this).text().trim() });
    이렇게 하면 안될까요?? 검증안됐습니다.

  • 유니파
    494
    2021-09-13 13:12:39 작성 2021-09-13 13:14:23 수정됨

    https://github.com/cheeriojs/cheerio/issues/968

    구글에 'cheerio get text without element'라고 검색하니 바로 나오네요..

  • 로그인을 하시면 답변을 등록할 수 있습니다.