lxml

Скріншот програми:
lxml
Дані програми:
Версія: 3.4.1
Дата завантаження: 17 Feb 15
Розробник: Martijn Faassen
Ліцензія: Безкоштовно
Популярність: 72

Rating: 5.0/5 (Total Votes: 1)

LXML є складним, потужний, безкоштовно і унікальний модуль Python, який пов'язує Libxml2 і LibXSLT бібліотеки, що дозволяє розробникам Python для роботи як з XML і HTML файли інсайдерської їх Python code.An обробки XML librarylxml є XML (Extensible Markup Language ) обробка бібліотека, написана на мові програмування Python, спеціально розроблений, щоб слідувати специфікації ElementTree API в максимально можливій мірі.
Це може продовжити API ElementTree виставити специфічну функціональність LibXSLT і libxml2 бібліотеки, такі як Relax NG (Next-Generation), XPath, XML-схеми, c14n, XSLT (Extensible Stylesheet Language), etc.Use LXML називати Python коду з XSLT stylesheetsDevelopers зможете використовувати програму LXML називати Python код з XSLT стилів і виразів XPath за допомогою функції розширення. Широкий асортимент підручників доступні на проекті і Rsquo; домашню сторінку (посилання в кінці статті).
Програмне забезпечення з відкритим вихідним кодом згідно з проектом і поєднує в собі функції повнота і швидкість вищезазначених бібліотек з простотою Пітона і Rsquo; з API (інтерфейс програмування додатків) .Getting почалося з lxmlIt досить легко встановити LXML на розподіл GNU / Linux з використанням архів з вихідним розподілені по Softoware та проектної & Rsquo, S Офіційний сайт. Просто завантажте вихідний пакет, зберегти його на вашому домашньому каталозі, розпакувати його, відкрийте термінал додаток і перейдіть в папку, здобутих архівних файлів (наприклад, CD /home/softoware/lxml-3.4.1).
Запустіть і lsquo; зробити і Rsquo; Команда скомпілювати програму, яка повинна прийняти близько 1-2 хвилин на сучасному комп'ютері. Після успішної компіляції, запуску і lsquo; зробити установку і Rsquo; Команда, як корінь або & lsquo; Судо зробити установку і Rsquo; Команда як адміністратор від процесу установки LXML wide.Supports системи GNU / Linux і Microsoft Windows операційної сістемиАвтоматіческіе програмне забезпечення офіційно підтримувані GNU / Linux і Microsoft Windows операційних систем. Вона була успішно протестована на 32-бітних і 64-розрядних комп'ютерах

Що нового У цьому випуску :.

  • Особливості додав:
  • Новий генератор HTMLFILE HTML супроводжувати зростаючий API XMLFILE серіалізациі. Патч на Бурак Арслана.
  • Виправлені помилки:
  • lxml.sax.ElementTreeContentHandler НЕ ініціалізувати його суперклас.

Що нового у версії 3.3.1:

  • Виправлені помилки:
  • LP # 1014290: HTML документи розібрані з parser.feed () не вдалося знайти елементи під час тегом ітерації
  • .
  • LP # 1273709: Будівництво в PyPy не вдалося через відсутність підтримки PyUnicode_Compare () і PyByteArray _ * () в C-API PyPy в
  • .
  • LP # 1274413: Збірка у MSVC не вдалося через відсутність & Quot; stdint.h і Quot; стандартний файл заголовка.
  • LP # 1274118: iterparse () не розібрати специфікації префікс файлів
  • .

Що нового у версії 3.0 Alpha 2

  • Особливості додав:
  • метод .iter () елементів тепер приймає аргументи тегів, як і Quot; {*} ім'я та Quot; шукати елементи з заданим ім'ям локального в будь-якому просторі імен. З цим доповненням, всі комбінації масок тепер працюють як очікувалося: & Quot; {нс} ім'я та Quot;, & Quot; {} ім'я та Quot;, & Quot; {*} ім'я та Quot;, & Quot; {нс} * & Quot;, & Quot; {} * і Quot; і & Quot; {*} * & Quot;. Зверніть увагу, що і Quot; ім'я & Quot; еквівалентно & Quot; {} ім'я & Quot;, а й Quot; * & Quot; це і Quot; {*} * & Quot;. Це ж зміна в .getiterator (), .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () і .itertext () методів; в strip_attributes (), strip_elements () і strip_tags () функції а також класу iterparse ().
  • C14N дозволяє задати інклюзивних префікси, які будуть запропоновані на вищому рівні під час ексклюзивного серіалізациі.
  • Виправлені помилки:
  • Передача довгих рядків Unicode в лінію подачі () аналізатор інтерфейсу не читав всю рядок.

Що нового у версії 2.3.5:

  • Помилка при злитті текстові вузли в element.remove ( ).
  • Збій у саксофон / цільової парсер при поданні порожній тип документа.

Що нового у версії 2.3.4:

  • Помилка при побудові nsmap (властивостей елементів) з порожній простір імен URI.
  • Аварія за ознакою раси стані, коли помилки (або користувача повідомлення) відбуваються під час різьбленням обробки XSLT.
  • XSLT стилів компіляції могла ігнорувати помилки компіляції.

Що нового у версії 2.3.2:

  • Особливості додав:
  • lxml.objectify.deannotate () має нові логічного типу cleanup_namespaces щодо усунення об'єктивують декларацій простору імен (і взагалі прибирати оголошення просторів імен) після видалення анотації типу.
  • lxml.objectify свою функцію самостійно вкладений () отримала в якості копії etree.SubElement, щоб уникнути в іншому випадку надлишкового імпорту lxml.etree на стороні користувача.
  • Виправлені помилки:
  • Виправлена ​​& Quot; нащадок & Quot; помилка в cssselect вдруге (після першої фіксації в LXML 2.3.1). Попередня зміна призвело до серйозного регресу продуктивності для основі XPath оцінки перекладного слова. Зверніть увагу, що при цьому порушується використання деяких з згенерованих виразами XPath як шляхів місця розташування XSLT, які раніше працювали в 2.3.1.
  • Виправлена ​​розбір деяких селекторів в cssselect. Прогалини після комбінаторів і Quot; І GT; & Quot;, & Quot; + & Quot; і & Quot; ~ & Quot; тепер правильно ігноруватися. Раніше в був розібраний як нащадок комбінатора. Наприклад, & Quot; DIV & GT; .foo і Quot; був розібраний так само, як і Quot; DIV & GT; * .foo і Quot; замість & Quot; DIV & GT; .foo і Quot ;.

Що нового у версії 2.3.1:

  • Особливості додав:
  • Нова опція kill_tags в lxml.html.clean Щоб видалити певні теги і їх вміст (тобто їх все поддерево).
  • pi.get () і pi.attrib на інструкцій з обробки розбору псевдо-атрибутів з текстового змісту інструкцій з обробки.
  • lxml.get_include () повертає список включають в себе шляхи, які можуть бути використані для складання зовнішнього коду C проти lxml.etree. Це спеціально обумовлено для статично пов'язаний LXML будує, коли код повинен скласти від тих же версій файлів заголовка як LXML собі.
  • Resolver.resolve_file () приймає додатковий параметр close_file, який налаштовує якщо (-як) об'єктний файл буде закритий після прочитання чи ні. За замовчуванням, файл буде закритий, а користувач не очікується, збереже посилання на нього.
  • Виправлені помилки:
  • Прибирання HTML не видалити "дані:". Посилання
  • Інтеграція html5lib парсер тепер використовує «офіційний» реалізацію в самій html5lib, що робить його роботу з новими релізами бібліотеки.
  • В lxml.sax, endElementNS () може неправильно відкидати простий ім'я тега, коли відповідне стартове подія виводиться той же простий ім'я тега, щоб бути в просторі імен за замовчуванням.
  • Коли відкрити файл-подібний об'єкт передається в розборі () або iterparse (), аналізатор більше не буде близько він після використання. Це повертається до зміни LXML 2,3, де всі файли будуть закриті. Це відповідальність користувачам правильно закрити (-подібних) файловий об'єкт, а також у випадках помилок.
  • помилки твердження lxml.html.cleaner, коли відкидаючи елементи верхнього рівня.
  • В lxml.cssselect, використовуйте XPath "// B '(скорочення від' A / нащадок-або-я :: вузла () / B ') замість' A / низхідного :: B" для CSS селектор нащадків ('B'). Це робить кілька крайні випадки, щоб бути узгоджується з поведінкою селектора в WebKit і Firefox, і робить більше CSS вираження дійсних шляху доступу (для використання в XSL: шаблон матчі).
  • В lxml.html, номери обраних тегів більше не з'являються в зібраних значень форми.
  • Додавання / видалення значення в / з множинного вибору поля форми правильно вибирає їх і знімає виділення їх.
  • Інші зміни:
  • Static будує можна вказати каталог для завантаження з опцією --download-реж.

Що нового у версії 2.3:

  • Особливості додав:
  • При пошуку дітей, lxml.objectify приймає '{} тег "в тому сенсі, порожній простір імен, на відміну від батьківського простору імен.
  • Виправлені помилки:
  • Після прочитання з файл-подібний об'єкт, аналізатор відразу викликає його метод .close ().
  • Після завершення розбору, iterparse () відразу закриває вхідний файл.
  • Робота навколо для libxml2 помилка, яка може залишити HTML-парсер в не-функціонального стану після обробки severly зламаною документ (фіксований в libxml2 2.7.8).
  • марка тег в HTML код очистки названий правильно шатер.
  • Інші зміни:
  • Деякі громадські функції в Cython рівня C-API мають більш чіткі типи повертаються.

Що нового у версії 2.2.8 / 2.3 Beta 1:

  • Збій у нових libxml2 версії, коли рухомих елементів між документами, які мали атрибути замінені вузлів XInclude.
  • функція XMLID () не вистачає додаткові аналізатора і base_url параметрів.
  • Пошук за шаблоном тегів в iterparse () була порушена в PY3.
  • lxml.html.open_in_browser () не працює в Python 3 у зв'язку з використанням os.tempnam. В даний час займає додатковий параметр "кодування" ,.

Вимоги

  • Python

Схожі програми

eLML
eLML

14 Apr 15

AutoLaTeX
AutoLaTeX

17 Feb 15

Beautiful Soup
Beautiful Soup

14 Apr 15

mdx_video
mdx_video

14 Apr 15

Інші програми розробника Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

lxml

Коментар не знайдено
додати коментар
Включіть картинки!