lxml

Скріншот програми:
lxml
Дані програми:
Версія: 3.4.4 оновлений
Дата завантаження: 12 May 15
Розробник: infrae.com
Ліцензія: Безкоштовно
Популярність: 70

Rating: nan/5 (Total Votes: 0)

LXML поєднує в собі швидкість цих бібліотек з простотою мови Python.
Сумісність з усіма версіями CPython від 2,4 до 3,2

Що нового У цьому випуску :.

  • lxml.html.iterlinks Тепер повертає посилання всередині тегів мета оновлення.
  • Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
  • аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
  • ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
  • XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
  • Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.

Що нового у версії 3.4.2:

  • lxml.html.iterlinks тепер повертає посилання всередині мета оновити теги.
  • Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
  • аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
  • ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
  • XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
  • Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.

Що нового у версії 3.3.2:

  • Властивості резольвер і версія, а також методи set_element_class_lookup () і makeelement (), загинули від iterparse об'єктів.
  • Примірники XMLSCHEMA, Schematron і RelaxNG НЕ очистити їх місцевий error_log перед запуском перевірки.
  • lxml.doctestcompare переплутали і Quot; очікується і Quot; і & Quot; поточна & Quot; в значеннях атрибутів.

Що нового у версії 3.3.1:

  • Виправлені помилки:
  • документи розібрані з parser.feed () не вдалося знайти елементи під тегом ітерації.
  • Будівництво в PyPy вдалося через відсутність підтримки PyUnicode_Compare () і PyByteArray _ * () в C-API PyPy в.
  • Компіляція в MSVC не вдалося через відсутність & Quot; stdint.h & Quot; стандартний файл заголовка.
  • iterparse () не розбереш специфікації префікс файлів.

Що нового у версії 3.3.0:

  • Виправлені помилки:
  • евристичний що відрізняє шляхи до файлів з URL, підтяглася виробляти менше помилкових негативів.

Що нового у версії 3.2.3:

  • Виправлена ​​підтримка Python 2.4, який загинув в 3.2 0,2.

Що нового у версії 3.2.1:

  • Методи apply_templates () і process_children () з елементи розширення XSLT отримали два нових логічних варіантів elements_only і remove_blank_text, що відмовитися або всі рядки або пропусками лише рядки зі списку результатів.

Що нового у версії 3.2.0:

  • Провідний пробіл може змінити поведінку рядка розбору функції в lxml.html.
  • рядок розбору функції в lxml.html є більш надійними в умовах незвичайної змісту HTML як фреймів або відсутній теги тіла.
  • помилки введення / виводу при спробі отримати доступ до файлів зі шляхами, які містять символи, відмінні від ASCII може підняти UnicodeDecodeError замість належним чином повідомлення про IOError.
  • Розбір з в пам'яті рядки відключив доступ до мережі в парсер за замовчуванням, і зробив наступні спроби розбору з URL невдачу.

Що нового у версії 3.1.2:

  • Передача атрибутів через простору імен-не знають API з саксофон міст (тобто handler.startElement () метод) не вдалося з TypeError.
  • Виправлена ​​помилка серіалізациі на виході XSLT при перетворенні результуюче дерево в рядок Unicode.

Що нового у версії 3.0.2:

  • Виправлена ​​помилка при завершенні роботи інтерпретатора, переключившись на Cython 0,17 0,3 для будівництва.

Що нового у версії 3.0:

  • c14n дозволяє задати інклюзивних префікси, які будуть запропоновані до згори- Рівень протягом ексклюзивному серіалізациі.
  • Початкова підтримка для будівництва в PyPy (через cpyext).
  • Предмети DTD отримали API, який дозволяє доступ на читання до їхніх заяв.
  • xpathgrep.py отримала підтримку для розбору рядка за рядком (наприклад з виходу GREP) і для оточуючих вихід з новою кореневої тег.
  • E-завод в lxml.builder приймає підтипи відомих типів даних (наприклад, струнних підтипів) при будівництві елементи навколо них.
  • Дерево ітерації і iterparse () з селективним аргументу тегом підтримує проходження набір тегів. Вузли дерева будуть повернуті ітераторів, якщо вони збігаються один з тегів.

Що нового у версії 2.3.5:

  • Помилка при злитті текстові вузли в element.remove ( ).
  • Збій у саксофон / цільової аналізатора при поданні порожній тип документа.

Що нового у версії 2.3.4:

  • Помилка при побудові nsmap (властивість елемента) з порожній простір імен URI.
  • Краш-за гонки стані, коли помилки (або користувача повідомлення) відбуваються під час обробки нарізного XSLT.
  • таблицю стилів XSLT збірник може ігнорувати помилки компіляції.

Що нового у версії 2.3.3:

  • Особливості додав:
  • lxml.html.tostring () отримала нові можливості серіалізациі with_tail і DOCTYPE.
  • Виправлені помилки:
  • Виправлена ​​помилка при використанні iterparse () для розбору HTML і проханням стартові події.
  • Виправлена ​​розбір більш селекторів в cssselect. Прогалини, перш ніж псевдо-елементів і псевдо-класів є значним, як це нащадок комбінатор. & Quot; E: псевдо-Quot; повинні розібрати само, як і Quot; E *: псевдо & Quot;, & Quot ні; E :. псевдо & Quot;

  • не «LI> lxml.html.diff більше не викликає виключення при ударі теги" IMG "атрибуту" SRC "без.

Що нового у версії 2.3.2:

  • Особливості додав:
  • lxml.objectify.deannotate () має логічне нових опцій cleanup_namespaces щодо усунення об'єктивувати оголошення просторів імен (і, як правило прибирати оголошення просторів імен) після видалення анотації типу.
  • lxml.objectify свою функцію самостійно вкладений () отримала як копії etree.SubElement, щоб уникнути в іншому випадку надлишковий імпорт lxml.etree на стороні користувача.
  • Виправлені помилки:
  • Виправлена ​​& Quot; нащадок & Quot; помилка в cssselect вдруге (після першої фіксації в LXML 2.3.1). Попередня зміна призвело до серйозного регресу продуктивності для основі XPath оцінки перекладного слова. Зверніть увагу, що це порушує використання деяких з згенерованих виразами XPath як шляхів місця розташування XSLT, які раніше працювали в 2.3.1.
  • Виправлена ​​розбір деяких селекторів в cssselect. Прогалини після комбінаторів і Quot; # & x3e; & Quot;, & Quot; + & Quot; і & Quot; ~ & Quot; тепер правильно ігноруватися. Раніше в був розібраний як нащадок комбінатора. Наприклад, & Quot; DIV & # x3e; .foo & Quot; був розібраний так само, як і Quot; СНУ & # x3e; * .foo & Quot; замість & Quot; DIV & # x3e; .foo & Quot ;.

Що нового у версії 2.3.1:

  • Особливості додав:
  • Нова опція kill_tags в lxml.html.clean видалити конкретні теги і їх вміст (тобто вся їх поддерево).
  • pi.get () і pi.attrib на інструкцій з обробки розбору псевдо-атрибутів з текстового змісту інструкцій з обробки.
  • lxml.get_include () повертає список включає шляхи, які можуть бути використані для складання зовнішнього коду C проти lxml.etree. Це спеціально обумовлено для статично пов'язаний LXML будує, коли код необхідно скомпілювати проти тих же версій файлів заголовка як LXML собі.
  • Resolver.resolve_file () приймає додатковий параметр, який налаштовує close_file якщо (-як) об'єктний файл буде закритий після прочитання чи ні. За замовчуванням, файл буде закритий, а користувач не очікується, зберегти посилання на нього.
  • Виправлені помилки:
  • Прибирання HTML не видалити "дані:". Посилання
  • Інтеграція html5lib парсер тепер використовує «офіційний» реалізацію в самій html5lib, що робить його роботу з новими випусками бібліотеки.
  • В lxml.sax, endElementNS () може неправильно відкидати простий ім'я тега, коли відповідне стартове подія виводиться той же простий ім'я тега, щоб бути в просторі імен за замовчуванням.
  • Коли відкрити файл-подібний об'єкт передається в розборі () або iterparse (), аналізатор більше не буде близько він після використання. Це повертається до зміни LXML 2.3, де всі файли будуть закриті. Це відповідальність користувачам правильно закрити (-подібних) об'єкт файлу, а також у випадках, про помилки.
  • помилки твердження lxml.html.cleaner, коли відкидаючи елементи верхнього рівня.
  • В lxml.cssselect, використовуйте XPath '// B' (скорочення від 'A / нащадок-або-сам :: вузол () / B') замість 'A / нащадок :: B' для CSS Селектор нащадків ("B"). Це робить кілька крайні випадки, щоб бути узгоджується з поведінкою селектора в WebKit і Firefox, і робить більше CSS вирази дійсних шляхів розташування (для використання в XSL: шаблон матчі).
  • В lxml.html, не визначена і # x3c; опція & # x3e; теги більше не з'являються в зібраних значень форми.
  • Додавання / видалення і # x3c; опція & # x3e; значення в / з множинного вибору поля форми правильно вибирає їх і знімає виділення їх.
  • Інші зміни:
  • Статичний будує можна вказати каталог для завантаження з опцією --download-реж.

Що нового у версії 2.3:

  • Особливості додав:
  • При пошуку дітей, lxml.objectify приймає '{} тег "в тому сенсі, порожній простір імен, на відміну від батьківського простору імен.
  • Виправлені помилки:
  • Після прочитання з файлового об'єкта, як, аналізатор негайно викликає його метод .close ().
  • Після завершення розбору, iterparse () відразу закриває вхідний файл.
  • Робота навколо для libxml2 помилка, яка може залишити HTML парсер в не-функціонального стану після розбору severly зламаною документ (фіксований в libxml2 2.7.8).
  • Марк тег в HTML код очистки названий правильно намет.
  • Інші зміни:
  • Деякі державні функції в Cython рівня C-API є більш чіткі типи повернення.

Що нового у версії 2.3beta1:

  • Виправлені помилки:
  • Збій в нових версіях libxml2 при переміщенні елементів між документами, які мали атрибути замінені вузлів XInclude.
  • функція XMLID () не вистачає додаткові аналізатора і base_url параметрів.
  • Пошук шаблонних тегів у iterparse () була порушена в PY3.
  • lxml.html.open_in_browser () не працює в Python 3 у зв'язку з використанням os.tempnam. Це в даний час займає додатковий параметр '' кодування.

Схожі програми

QuoteOfTheDay
QuoteOfTheDay

13 May 15

wxPython
wxPython

13 Apr 15

OpenPyxl
OpenPyxl

19 Jul 15

PyTTY
PyTTY

23 Jul 15

lxml

Коментар не знайдено
додати коментар
Включіть картинки!
Пошук за категоріями