lxml

Скріншот програми:
lxml
Дані програми:
Версія: 3.4.1
Дата завантаження: 17 Feb 15
Розробник: Martijn Faassen
Ліцензія: Безкоштовно
Популярність: 72

Rating: 5.0/5 (Total Votes: 1)

LXML є складним, потужний, безкоштовно і унікальний модуль Python, який пов'язує Libxml2 і LibXSLT бібліотеки, що дозволяє розробникам Python для роботи як з XML і HTML файли інсайдерської їх Python code.An обробки XML librarylxml є XML (Extensible Markup Language ) обробка бібліотека, написана на мові програмування Python, спеціально розроблений, щоб слідувати специфікації ElementTree API в максимально можливій мірі.
Це може продовжити API ElementTree виставити специфічну функціональність LibXSLT і libxml2 бібліотеки, такі як Relax NG (Next-Generation), XPath, XML-схеми, c14n, XSLT (Extensible Stylesheet Language), etc.Use LXML називати Python коду з XSLT stylesheetsDevelopers зможете використовувати програму LXML називати Python код з XSLT стилів і виразів XPath за допомогою функції розширення. Широкий асортимент підручників доступні на проекті і Rsquo; домашню сторінку (посилання в кінці статті).
Програмне забезпечення з відкритим вихідним кодом згідно з проектом і поєднує в собі функції повнота і швидкість вищезазначених бібліотек з простотою Пітона і Rsquo; з API (інтерфейс програмування додатків) .Getting почалося з lxmlIt досить легко встановити LXML на розподіл GNU / Linux з використанням архів з вихідним розподілені по Softoware та проектної & Rsquo, S Офіційний сайт. Просто завантажте вихідний пакет, зберегти його на вашому домашньому каталозі, розпакувати його, відкрийте термінал додаток і перейдіть в папку, здобутих архівних файлів (наприклад, CD /home/softoware/lxml-3.4.1).
Запустіть і lsquo; зробити і Rsquo; Команда скомпілювати програму, яка повинна прийняти близько 1-2 хвилин на сучасному комп'ютері. Після успішної компіляції, запуску і lsquo; зробити установку і Rsquo; Команда, як корінь або & lsquo; Судо зробити установку і Rsquo; Команда як адміністратор від процесу установки LXML wide.Supports системи GNU / Linux і Microsoft Windows операційної сістемиАвтоматіческіе програмне забезпечення офіційно підтримувані GNU / Linux і Microsoft Windows операційних систем. Вона була успішно протестована на 32-бітних і 64-розрядних комп'ютерах

Що нового У цьому випуску :.

  • Особливості додав:
  • Новий генератор HTMLFILE HTML супроводжувати зростаючий API XMLFILE серіалізациі. Патч на Бурак Арслана.
  • Виправлені помилки:
  • lxml.sax.ElementTreeContentHandler НЕ ініціалізувати його суперклас.

Що нового у версії 3.3.1:

  • Виправлені помилки:
  • LP # 1014290: HTML документи розібрані з parser.feed () не вдалося знайти елементи під час тегом ітерації
  • .
  • LP # 1273709: Будівництво в PyPy не вдалося через відсутність підтримки PyUnicode_Compare () і PyByteArray _ * () в C-API PyPy в
  • .
  • LP # 1274413: Збірка у MSVC не вдалося через відсутність & Quot; stdint.h і Quot; стандартний файл заголовка.
  • LP # 1274118: iterparse () не розібрати специфікації префікс файлів
  • .

Що нового у версії 3.0 Alpha 2

  • Особливості додав:
  • метод .iter () елементів тепер приймає аргументи тегів, як і Quot; {*} ім'я та Quot; шукати елементи з заданим ім'ям локального в будь-якому просторі імен. З цим доповненням, всі комбінації масок тепер працюють як очікувалося: & Quot; {нс} ім'я та Quot;, & Quot; {} ім'я та Quot;, & Quot; {*} ім'я та Quot;, & Quot; {нс} * & Quot;, & Quot; {} * і Quot; і & Quot; {*} * & Quot;. Зверніть увагу, що і Quot; ім'я & Quot; еквівалентно & Quot; {} ім'я & Quot;, а й Quot; * & Quot; це і Quot; {*} * & Quot;. Це ж зміна в .getiterator (), .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () і .itertext () методів; в strip_attributes (), strip_elements () і strip_tags () функції а також класу iterparse ().
  • C14N дозволяє задати інклюзивних префікси, які будуть запропоновані на вищому рівні під час ексклюзивного серіалізациі.
  • Виправлені помилки:
  • Передача довгих рядків Unicode в лінію подачі () аналізатор інтерфейсу не читав всю рядок.

Що нового у версії 2.3.5:

  • Помилка при злитті текстові вузли в element.remove ( ).
  • Збій у саксофон / цільової парсер при поданні порожній тип документа.

Що нового у версії 2.3.4:

  • Помилка при побудові nsmap (властивостей елементів) з порожній простір імен URI.
  • Аварія за ознакою раси стані, коли помилки (або користувача повідомлення) відбуваються під час різьбленням обробки XSLT.
  • XSLT стилів компіляції могла ігнорувати помилки компіляції.

Що нового у версії 2.3.2:

  • Особливості додав:
  • lxml.objectify.deannotate () має нові логічного типу cleanup_namespaces щодо усунення об'єктивують декларацій простору імен (і взагалі прибирати оголошення просторів імен) після видалення анотації типу.
  • lxml.objectify свою функцію самостійно вкладений () отримала в якості копії etree.SubElement, щоб уникнути в іншому випадку надлишкового імпорту lxml.etree на стороні користувача.
  • Виправлені помилки:
  • Виправлена ​​& Quot; нащадок & Quot; помилка в cssselect вдруге (після першої фіксації в LXML 2.3.1). Попередня зміна призвело до серйозного регресу продуктивності для основі XPath оцінки перекладного слова. Зверніть увагу, що при цьому порушується використання деяких з згенерованих виразами XPath як шляхів місця розташування XSLT, які раніше працювали в 2.3.1.
  • Виправлена ​​розбір деяких селекторів в cssselect. Прогалини після комбінаторів і Quot; І GT; & Quot;, & Quot; + & Quot; і & Quot; ~ & Quot; тепер правильно ігноруватися. Раніше в був розібраний як нащадок комбінатора. Наприклад, & Quot; DIV & GT; .foo і Quot; був розібраний так само, як і Quot; DIV & GT; * .foo і Quot; замість & Quot; DIV & GT; .foo і Quot ;.

Що нового у версії 2.3.1:

  • Особливості додав:
  • Нова опція kill_tags в lxml.html.clean Щоб видалити певні теги і їх вміст (тобто їх все поддерево).
  • pi.get () і pi.attrib на інструкцій з обробки розбору псевдо-атрибутів з текстового змісту інструкцій з обробки.
  • lxml.get_include () повертає список включають в себе шляхи, які можуть бути використані для складання зовнішнього коду C проти lxml.etree. Це спеціально обумовлено для статично пов'язаний LXML будує, коли код повинен скласти від тих же версій файлів заголовка як LXML собі.
  • Resolver.resolve_file () приймає додатковий параметр close_file, який налаштовує якщо (-як) об'єктний файл буде закритий після прочитання чи ні. За замовчуванням, файл буде закритий, а користувач не очікується, збереже посилання на нього.
  • Виправлені помилки:
  • Прибирання HTML не видалити "дані:". Посилання
  • Інтеграція html5lib парсер тепер використовує «офіційний» реалізацію в самій html5lib, що робить його роботу з новими релізами бібліотеки.
  • В lxml.sax, endElementNS () може неправильно відкидати простий ім'я тега, коли відповідне стартове подія виводиться той же простий ім'я тега, щоб бути в просторі імен за замовчуванням.
  • Коли відкрити файл-подібний об'єкт передається в розборі () або iterparse (), аналізатор більше не буде близько він після використання. Це повертається до зміни LXML 2,3, де всі файли будуть закриті. Це відповідальність користувачам правильно закрити (-подібних) файловий об'єкт, а також у випадках помилок.
  • помилки твердження lxml.html.cleaner, коли відкидаючи елементи верхнього рівня.
  • В lxml.cssselect, використовуйте XPath "// B '(скорочення від' A / нащадок-або-я :: вузла () / B ') замість' A / низхідного :: B" для CSS селектор нащадків ('B'). Це робить кілька крайні випадки, щоб бути узгоджується з поведінкою селектора в WebKit і Firefox, і робить більше CSS вираження дійсних шляху доступу (для використання в XSL: шаблон матчі).
  • В lxml.html, номери обраних тегів більше не з'являються в зібраних значень форми.
  • Додавання / видалення значення в / з множинного вибору поля форми правильно вибирає їх і знімає виділення їх.
  • Інші зміни:
  • Static будує можна вказати каталог для завантаження з опцією --download-реж.

Що нового у версії 2.3:

  • Особливості додав:
  • При пошуку дітей, lxml.objectify приймає '{} тег "в тому сенсі, порожній простір імен, на відміну від батьківського простору імен.
  • Виправлені помилки:
  • Після прочитання з файл-подібний об'єкт, аналізатор відразу викликає його метод .close ().
  • Після завершення розбору, iterparse () відразу закриває вхідний файл.
  • Робота навколо для libxml2 помилка, яка може залишити HTML-парсер в не-функціонального стану після обробки severly зламаною документ (фіксований в libxml2 2.7.8).
  • марка тег в HTML код очистки названий правильно шатер.
  • Інші зміни:
  • Деякі громадські функції в Cython рівня C-API мають більш чіткі типи повертаються.

Що нового у версії 2.2.8 / 2.3 Beta 1:

  • Збій у нових libxml2 версії, коли рухомих елементів між документами, які мали атрибути замінені вузлів XInclude.
  • функція XMLID () не вистачає додаткові аналізатора і base_url параметрів.
  • Пошук за шаблоном тегів в iterparse () була порушена в PY3.
  • lxml.html.open_in_browser () не працює в Python 3 у зв'язку з використанням os.tempnam. В даний час займає додатковий параметр "кодування" ,.

Вимоги

  • Python

Схожі програми

htmLawed
htmLawed

20 Feb 15

MIB Smithy SDK
MIB Smithy SDK

18 Feb 15

oXygen XML Author
oXygen XML Author

17 Jul 15

sphinxjp.themes.s6
sphinxjp.themes.s6

20 Feb 15

Інші програми розробника Martijn Faassen

hurry.resource
hurry.resource

11 May 15

z3c.relationfield
z3c.relationfield

14 Apr 15

lxml

Коментар не знайдено
додати коментар
Включіть картинки!