깨진 HTML구문 분석에 대한 지원은 libxml2의 복구 알고리즘에 전적으로 의존합니다. 파서가 처리 할 수 없을 정도로 심하게 깨진 문서를 찾으면 lxml의 잘못이 아닙니다. 또한 결과 트리에 원본 문서의 모든 데이터가 포함된다는 보장은 없습니다. 파서는 구문 분석유지에 어려움을 겪을 때 심각하게 부서진 부분을 떨어뜨려야 할 수 있습니다. 특히 잘못 배치된 메타 태그는 이로 인해 인코딩 문제가 발생할 수 있습니다. 구문 분석 이벤트는 tuples(이벤트 유형, 개체)입니다. ElementTree 및 lxml.etree에서 지원하는 이벤트 유형은 문자열 `시작`, `끝`, `시작 ns` 및 `end-ns`입니다. `시작` 및 `끝` 이벤트는 열기 및 닫는 요소를 나타냅니다. 각 요소 인스턴스를 함께 수반합니다. 기본적으로 `end` 이벤트만 생성되는 반면 위의 예제에서는 `시작` 및 `종료` 이벤트의 생성을 요청했습니다. lxml.etree는 ElementTree 라이브러리보다 파이썬 유니코드 문자열에 대한 광범위한 지원을 합니다.

우선 ElementTree에서 예외를 발생시킬 경우 lxml.etree의 파서가 유니코드 문자열을 바로 처리할 수 있습니다. 이는 XML() 함수를 사용하여 소스 코드에 포함된 XML 코드에 가장 유용합니다. 이는 원래 ElementTree(및 목록)와는 차이가 있으며, 여기서 요소는 여러 수의 트리의 여러 위치에 배치될 수 있습니다. lxml.etree에서 요소는 한 번에 한 나무의 한 위치에만 앉을 수 있습니다. MacOS 또는 Linux를 사용하는 경우 터미널에서 이 명령을 실행하여 lxml을 설치할 수 있습니다. 원래 ElementTree로 돌아가기: 특정 종류의 메시지를 필터링하려면 오류 로그에서 다른 filter_*() 메서드를 사용합니다(lxml.etree._ListErrorLog 클래스 참조). iterparse()에 대한 매우 중요한 사용 사례는 데이터베이스 덤프와 같은 대용량 생성된 XML 파일을 구문 분석하는 것입니다. 대부분의 경우 이러한 XML 형식에는 루트 노드 바로 아래에 걸려 수천 번 반복되는 하나의 주 데이터 항목 요소만 있습니다. 이 경우 lxml.etree가 트리 빌드를 수행하도록 하고 데이터 추출을 위해 일반 트리 API를 사용하여 이 하나의 요소를 정확히 가로채는 것이 좋습니다.

lxml은 로컬 파일, HTTP URL 또는 FTP URL에서 구문 분석할 수 있습니다. 또한 gzip 압축 XML 파일 (.gz)을 자동으로 감지하고 읽습니다. 지금까지는 새 요소를 만들고 특성을 할당하는 등만 고려했습니다. 이제 HTML 또는 XML 파일이 이미 있고 특정 정보를 추출하기 위해 구문 분석하려는 예제를 살펴보겠습니다. 첫 번째 예제에서 만든 HTML 파일이 있다고 가정하면 한 특정 요소의 태그 이름을 가져옵니다. 단일 태그에만 관심이 있는 경우 이름을 iter()에 전달하여 필터링할 수 있습니다. lxml 3.0부터 는 두 개 이상의 태그를 전달하여 반복 중에 여러 태그를 가로챌 수도 있습니다. lxml에서는 .read_events() 메서드를 한 번 호출하는 것으로 충분하며 새 이벤트를 사용할 수 있을 때 반환하는 반복기를 다시 사용할 수 있습니다. 여러 네임스페이스를 처리할 때각 네임스페이스 URI에 대해 하나의 ElementMaker를 정의하는 것이 좋습니다.

다시 한 번 위의 예제에서 명명된 상수에서 태그 작성기의 사전 정의 방법을 참고하십시오. 따라서 네임스페이스의 모든 태그 선언을 하나의 Python 모듈에 쉽게 넣고 거기에서 태그 이름 상수를 가져오고 사용할 수 있습니다. 이렇게 하면 오타나 실수로 네임스페이스가 누락된 등의 함정을 피할 수 있습니다. lxml 2.0 이상(ElementTree 1.3) 에서는 직렬화 함수가 XML 직렬화 보다 더 많은 작업을 수행할 수 있습니다. html로 직렬화하거나 메서드 키워드를 전달하여 텍스트 콘텐츠를 추출할 수 있습니다: lxml은 XML 및 HTML을 구문 분석하기 위한 매우 간단하고 강력한 API를 제공합니다. 이벤트 기반 API(현재 XML에만)를 사용하여 한 단계 구문 분석과 단계별 구문 분석도 지원합니다.