lxml

Скріншот програми:
lxml
Дані програми:
Версія: 3.4.4 оновлений
Дата завантаження: 12 May 15
Розробник: infrae.com
Ліцензія: Безкоштовно
Популярність: 70

Rating: nan/5 (Total Votes: 0)

LXML поєднує в собі швидкість цих бібліотек з простотою мови Python.
Сумісність з усіма версіями CPython від 2,4 до 3,2

Що нового У цьому випуску :.

  • lxml.html.iterlinks Тепер повертає посилання всередині тегів мета оновлення.
  • Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
  • аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
  • ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
  • XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
  • Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.

Що нового у версії 3.4.2:

  • lxml.html.iterlinks тепер повертає посилання всередині мета оновити теги.
  • Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
  • аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
  • ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
  • XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
  • Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.

Що нового у версії 3.3.2:

  • Властивості резольвер і версія, а також методи set_element_class_lookup () і makeelement (), загинули від iterparse об'єктів.
  • Примірники XMLSCHEMA, Schematron і RelaxNG НЕ очистити їх місцевий error_log перед запуском перевірки.
  • lxml.doctestcompare переплутали і Quot; очікується і Quot; і & Quot; поточна & Quot; в значеннях атрибутів.

Що нового у версії 3.3.1:

  • Виправлені помилки:
  • документи розібрані з parser.feed () не вдалося знайти елементи під тегом ітерації.
  • Будівництво в PyPy вдалося через відсутність підтримки PyUnicode_Compare () і PyByteArray _ * () в C-API PyPy в.
  • Компіляція в MSVC не вдалося через відсутність & Quot; stdint.h & Quot; стандартний файл заголовка.
  • iterparse () не розбереш специфікації префікс файлів.

Що нового у версії 3.3.0:

  • Виправлені помилки:
  • евристичний що відрізняє шляхи до файлів з URL, підтяглася виробляти менше помилкових негативів.

Що нового у версії 3.2.3:

  • Виправлена ​​підтримка Python 2.4, який загинув в 3.2 0,2.

Що нового у версії 3.2.1:

  • Методи apply_templates () і process_children () з елементи розширення XSLT отримали два нових логічних варіантів elements_only і remove_blank_text, що відмовитися або всі рядки або пропусками лише рядки зі списку результатів.

Що нового у версії 3.2.0:

  • Провідний пробіл може змінити поведінку рядка розбору функції в lxml.html.
  • рядок розбору функції в lxml.html є більш надійними в умовах незвичайної змісту HTML як фреймів або відсутній теги тіла.
  • помилки введення / виводу при спробі отримати доступ до файлів зі шляхами, які містять символи, відмінні від ASCII може підняти UnicodeDecodeError замість належним чином повідомлення про IOError.
  • Розбір з в пам'яті рядки відключив доступ до мережі в парсер за замовчуванням, і зробив наступні спроби розбору з URL невдачу.

Що нового у версії 3.1.2:

  • Передача атрибутів через простору імен-не знають API з саксофон міст (тобто handler.startElement () метод) не вдалося з TypeError.
  • Виправлена ​​помилка серіалізациі на виході XSLT при перетворенні результуюче дерево в рядок Unicode.

Що нового у версії 3.0.2:

  • Виправлена ​​помилка при завершенні роботи інтерпретатора, переключившись на Cython 0,17 0,3 для будівництва.

Що нового у версії 3.0:

  • c14n дозволяє задати інклюзивних префікси, які будуть запропоновані до згори- Рівень протягом ексклюзивному серіалізациі.
  • Початкова підтримка для будівництва в PyPy (через cpyext).
  • Предмети DTD отримали API, який дозволяє доступ на читання до їхніх заяв.
  • xpathgrep.py отримала підтримку для розбору рядка за рядком (наприклад з виходу GREP) і для оточуючих вихід з новою кореневої тег.
  • E-завод в lxml.builder приймає підтипи відомих типів даних (наприклад, струнних підтипів) при будівництві елементи навколо них.
  • Дерево ітерації і iterparse () з селективним аргументу тегом підтримує проходження набір тегів. Вузли дерева будуть повернуті ітераторів, якщо вони збігаються один з тегів.

Що нового у версії 2.3.5:

  • Помилка при злитті текстові вузли в element.remove ( ).
  • Збій у саксофон / цільової аналізатора при поданні порожній тип документа.

Що нового у версії 2.3.4:

  • Помилка при побудові nsmap (властивість елемента) з порожній простір імен URI.
  • Краш-за гонки стані, коли помилки (або користувача повідомлення) відбуваються під час обробки нарізного XSLT.
  • таблицю стилів XSLT збірник може ігнорувати помилки компіляції.

Що нового у версії 2.3.3:

  • Особливості додав:
  • lxml.html.tostring () отримала нові можливості серіалізациі with_tail і DOCTYPE.
  • Виправлені помилки:
  • Виправлена ​​помилка при використанні iterparse () для розбору HTML і проханням стартові події.
  • Виправлена ​​розбір більш селекторів в cssselect. Прогалини, перш ніж псевдо-елементів і псевдо-класів є значним, як це нащадок комбінатор. & Quot; E: псевдо-Quot; повинні розібрати само, як і Quot; E *: псевдо & Quot;, & Quot ні; E :. псевдо & Quot;

  • не «LI> lxml.html.diff більше не викликає виключення при ударі теги" IMG "атрибуту" SRC "без.

Що нового у версії 2.3.2:

  • Особливості додав:
  • lxml.objectify.deannotate () має логічне нових опцій cleanup_namespaces щодо усунення об'єктивувати оголошення просторів імен (і, як правило прибирати оголошення просторів імен) після видалення анотації типу.
  • lxml.objectify свою функцію самостійно вкладений () отримала як копії etree.SubElement, щоб уникнути в іншому випадку надлишковий імпорт lxml.etree на стороні користувача.
  • Виправлені помилки:
  • Виправлена ​​& Quot; нащадок & Quot; помилка в cssselect вдруге (після першої фіксації в LXML 2.3.1). Попередня зміна призвело до серйозного регресу продуктивності для основі XPath оцінки перекладного слова. Зверніть увагу, що це порушує використання деяких з згенерованих виразами XPath як шляхів місця розташування XSLT, які раніше працювали в 2.3.1.
  • Виправлена ​​розбір деяких селекторів в cssselect. Прогалини після комбінаторів і Quot; # & x3e; & Quot;, & Quot; + & Quot; і & Quot; ~ & Quot; тепер правильно ігноруватися. Раніше в був розібраний як нащадок комбінатора. Наприклад, & Quot; DIV & # x3e; .foo & Quot; був розібраний так само, як і Quot; СНУ & # x3e; * .foo & Quot; замість & Quot; DIV & # x3e; .foo & Quot ;.

Що нового у версії 2.3.1:

  • Особливості додав:
  • Нова опція kill_tags в lxml.html.clean видалити конкретні теги і їх вміст (тобто вся їх поддерево).
  • pi.get () і pi.attrib на інструкцій з обробки розбору псевдо-атрибутів з текстового змісту інструкцій з обробки.
  • lxml.get_include () повертає список включає шляхи, які можуть бути використані для складання зовнішнього коду C проти lxml.etree. Це спеціально обумовлено для статично пов'язаний LXML будує, коли код необхідно скомпілювати проти тих же версій файлів заголовка як LXML собі.
  • Resolver.resolve_file () приймає додатковий параметр, який налаштовує close_file якщо (-як) об'єктний файл буде закритий після прочитання чи ні. За замовчуванням, файл буде закритий, а користувач не очікується, зберегти посилання на нього.
  • Виправлені помилки:
  • Прибирання HTML не видалити "дані:". Посилання
  • Інтеграція html5lib парсер тепер використовує «офіційний» реалізацію в самій html5lib, що робить його роботу з новими випусками бібліотеки.
  • В lxml.sax, endElementNS () може неправильно відкидати простий ім'я тега, коли відповідне стартове подія виводиться той же простий ім'я тега, щоб бути в просторі імен за замовчуванням.
  • Коли відкрити файл-подібний об'єкт передається в розборі () або iterparse (), аналізатор більше не буде близько він після використання. Це повертається до зміни LXML 2.3, де всі файли будуть закриті. Це відповідальність користувачам правильно закрити (-подібних) об'єкт файлу, а також у випадках, про помилки.
  • помилки твердження lxml.html.cleaner, коли відкидаючи елементи верхнього рівня.
  • В lxml.cssselect, використовуйте XPath '// B' (скорочення від 'A / нащадок-або-сам :: вузол () / B') замість 'A / нащадок :: B' для CSS Селектор нащадків ("B"). Це робить кілька крайні випадки, щоб бути узгоджується з поведінкою селектора в WebKit і Firefox, і робить більше CSS вирази дійсних шляхів розташування (для використання в XSL: шаблон матчі).
  • В lxml.html, не визначена і # x3c; опція & # x3e; теги більше не з'являються в зібраних значень форми.
  • Додавання / видалення і # x3c; опція & # x3e; значення в / з множинного вибору поля форми правильно вибирає їх і знімає виділення їх.
  • Інші зміни:
  • Статичний будує можна вказати каталог для завантаження з опцією --download-реж.

Що нового у версії 2.3:

  • Особливості додав:
  • При пошуку дітей, lxml.objectify приймає '{} тег "в тому сенсі, порожній простір імен, на відміну від батьківського простору імен.
  • Виправлені помилки:
  • Після прочитання з файлового об'єкта, як, аналізатор негайно викликає його метод .close ().
  • Після завершення розбору, iterparse () відразу закриває вхідний файл.
  • Робота навколо для libxml2 помилка, яка може залишити HTML парсер в не-функціонального стану після розбору severly зламаною документ (фіксований в libxml2 2.7.8).
  • Марк тег в HTML код очистки названий правильно намет.
  • Інші зміни:
  • Деякі державні функції в Cython рівня C-API є більш чіткі типи повернення.

Що нового у версії 2.3beta1:

  • Виправлені помилки:
  • Збій в нових версіях libxml2 при переміщенні елементів між документами, які мали атрибути замінені вузлів XInclude.
  • функція XMLID () не вистачає додаткові аналізатора і base_url параметрів.
  • Пошук шаблонних тегів у iterparse () була порушена в PY3.
  • lxml.html.open_in_browser () не працює в Python 3 у зв'язку з використанням os.tempnam. Це в даний час займає додатковий параметр '' кодування.

Схожі програми

jprops
jprops

1 Mar 15

pylibcurl
pylibcurl

13 May 15

promise
promise

28 Feb 15

lxml

Коментар не знайдено
додати коментар
Включіть картинки!
Пошук за категоріями