Безкоштовно завантажити lxml для Web ::: модулі

lxml

Скріншот програми:

Дані програми:

Версія: 3.4.4 ^{оновлений}

Дата завантаження: 12 May 15

Розробник: infrae.com

Ліцензія: Безкоштовно

Популярність: 245

Скачати

Currently 4.50/5
1
2
3
4
5

Rating: 4.5/5 (Total Votes: 2)

LXML поєднує в собі швидкість цих бібліотек з простотою мови Python.
Сумісність з усіма версіями CPython від 2,4 до 3,2

Що нового У цьому випуску :.

lxml.html.iterlinks Тепер повертає посилання всередині тегів мета оновлення.
Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.

Що нового у версії 3.4.2:

lxml.html.iterlinks тепер повертає посилання всередині мета оновити теги.
Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.

Що нового у версії 3.3.2:

Властивості резольвер і версія, а також методи set_element_class_lookup () і makeelement (), загинули від iterparse об'єктів.
Примірники XMLSCHEMA, Schematron і RelaxNG НЕ очистити їх місцевий error_log перед запуском перевірки.
lxml.doctestcompare переплутали і Quot; очікується і Quot; і & Quot; поточна & Quot; в значеннях атрибутів.

Що нового у версії 3.3.1:

Виправлені помилки:
документи розібрані з parser.feed () не вдалося знайти елементи під тегом ітерації.
Будівництво в PyPy вдалося через відсутність підтримки PyUnicode_Compare () і PyByteArray _ * () в C-API PyPy в.
Компіляція в MSVC не вдалося через відсутність & Quot; stdint.h & Quot; стандартний файл заголовка.
iterparse () не розбереш специфікації префікс файлів.

Що нового у версії 3.3.0:

Виправлені помилки:
евристичний що відрізняє шляхи до файлів з URL, підтяглася виробляти менше помилкових негативів.

Що нового у версії 3.2.3:

Виправлена підтримка Python 2.4, який загинув в 3.2 0,2.

Що нового у версії 3.2.1:

Методи apply_templates () і process_children () з елементи розширення XSLT отримали два нових логічних варіантів elements_only і remove_blank_text, що відмовитися або всі рядки або пропусками лише рядки зі списку результатів.

Що нового у версії 3.2.0:

Провідний пробіл може змінити поведінку рядка розбору функції в lxml.html.
рядок розбору функції в lxml.html є більш надійними в умовах незвичайної змісту HTML як фреймів або відсутній теги тіла.
помилки введення / виводу при спробі отримати доступ до файлів зі шляхами, які містять символи, відмінні від ASCII може підняти UnicodeDecodeError замість належним чином повідомлення про IOError.
Розбір з в пам'яті рядки відключив доступ до мережі в парсер за замовчуванням, і зробив наступні спроби розбору з URL невдачу.

Що нового у версії 3.1.2:

Передача атрибутів через простору імен-не знають API з саксофон міст (тобто handler.startElement () метод) не вдалося з TypeError.
Виправлена помилка серіалізациі на виході XSLT при перетворенні результуюче дерево в рядок Unicode.

Що нового у версії 3.0.2:

Виправлена помилка при завершенні роботи інтерпретатора, переключившись на Cython 0,17 0,3 для будівництва.

Що нового у версії 3.0:

c14n дозволяє задати інклюзивних префікси, які будуть запропоновані до згори- Рівень протягом ексклюзивному серіалізациі.
Початкова підтримка для будівництва в PyPy (через cpyext).
Предмети DTD отримали API, який дозволяє доступ на читання до їхніх заяв.
xpathgrep.py отримала підтримку для розбору рядка за рядком (наприклад з виходу GREP) і для оточуючих вихід з новою кореневої тег.
E-завод в lxml.builder приймає підтипи відомих типів даних (наприклад, струнних підтипів) при будівництві елементи навколо них.
Дерево ітерації і iterparse () з селективним аргументу тегом підтримує проходження набір тегів. Вузли дерева будуть повернуті ітераторів, якщо вони збігаються один з тегів.

Що нового у версії 2.3.5:

Помилка при злитті текстові вузли в element.remove ( ).
Збій у саксофон / цільової аналізатора при поданні порожній тип документа.

Що нового у версії 2.3.4:

Помилка при побудові nsmap (властивість елемента) з порожній простір імен URI.
Краш-за гонки стані, коли помилки (або користувача повідомлення) відбуваються під час обробки нарізного XSLT.
таблицю стилів XSLT збірник може ігнорувати помилки компіляції.

Що нового у версії 2.3.3:

Особливості додав:
lxml.html.tostring () отримала нові можливості серіалізациі with_tail і DOCTYPE.
Виправлені помилки:
Виправлена помилка при використанні iterparse () для розбору HTML і проханням стартові події.
Виправлена розбір більш селекторів в cssselect. Прогалини, перш ніж псевдо-елементів і псевдо-класів є значним, як це нащадок комбінатор. & Quot; E: псевдо-Quot; повинні розібрати само, як і Quot; E *: псевдо & Quot;, & Quot ні; E :. псевдо & Quot;

Що нового у версії 2.3.2:

Особливості додав:
lxml.objectify.deannotate () має логічне нових опцій cleanup_namespaces щодо усунення об'єктивувати оголошення просторів імен (і, як правило прибирати оголошення просторів імен) після видалення анотації типу.
lxml.objectify свою функцію самостійно вкладений () отримала як копії etree.SubElement, щоб уникнути в іншому випадку надлишковий імпорт lxml.etree на стороні користувача.
Виправлені помилки:
Виправлена & Quot; нащадок & Quot; помилка в cssselect вдруге (після першої фіксації в LXML 2.3.1). Попередня зміна призвело до серйозного регресу продуктивності для основі XPath оцінки перекладного слова. Зверніть увагу, що це порушує використання деяких з згенерованих виразами XPath як шляхів місця розташування XSLT, які раніше працювали в 2.3.1.
Виправлена розбір деяких селекторів в cssselect. Прогалини після комбінаторів і Quot; # & x3e; & Quot;, & Quot; + & Quot; і & Quot; ~ & Quot; тепер правильно ігноруватися. Раніше в був розібраний як нащадок комбінатора. Наприклад, & Quot; DIV & # x3e; .foo & Quot; був розібраний так само, як і Quot; СНУ & # x3e; * .foo & Quot; замість & Quot; DIV & # x3e; .foo & Quot ;.

Що нового у версії 2.3.1:

Особливості додав:
Нова опція kill_tags в lxml.html.clean видалити конкретні теги і їх вміст (тобто вся їх поддерево).
pi.get () і pi.attrib на інструкцій з обробки розбору псевдо-атрибутів з текстового змісту інструкцій з обробки.
lxml.get_include () повертає список включає шляхи, які можуть бути використані для складання зовнішнього коду C проти lxml.etree. Це спеціально обумовлено для статично пов'язаний LXML будує, коли код необхідно скомпілювати проти тих же версій файлів заголовка як LXML собі.
Resolver.resolve_file () приймає додатковий параметр, який налаштовує close_file якщо (-як) об'єктний файл буде закритий після прочитання чи ні. За замовчуванням, файл буде закритий, а користувач не очікується, зберегти посилання на нього.
Виправлені помилки:
Прибирання HTML не видалити "дані:". Посилання
Інтеграція html5lib парсер тепер використовує «офіційний» реалізацію в самій html5lib, що робить його роботу з новими випусками бібліотеки.
В lxml.sax, endElementNS () може неправильно відкидати простий ім'я тега, коли відповідне стартове подія виводиться той же простий ім'я тега, щоб бути в просторі імен за замовчуванням.
Коли відкрити файл-подібний об'єкт передається в розборі () або iterparse (), аналізатор більше не буде близько він після використання. Це повертається до зміни LXML 2.3, де всі файли будуть закриті. Це відповідальність користувачам правильно закрити (-подібних) об'єкт файлу, а також у випадках, про помилки.
помилки твердження lxml.html.cleaner, коли відкидаючи елементи верхнього рівня.
В lxml.cssselect, використовуйте XPath '// B' (скорочення від 'A / нащадок-або-сам :: вузол () / B') замість 'A / нащадок :: B' для CSS Селектор нащадків ("B"). Це робить кілька крайні випадки, щоб бути узгоджується з поведінкою селектора в WebKit і Firefox, і робить більше CSS вирази дійсних шляхів розташування (для використання в XSL: шаблон матчі).
В lxml.html, не визначена і # x3c; опція & # x3e; теги більше не з'являються в зібраних значень форми.
Додавання / видалення і # x3c; опція & # x3e; значення в / з множинного вибору поля форми правильно вибирає їх і знімає виділення їх.
Інші зміни:
Статичний будує можна вказати каталог для завантаження з опцією --download-реж.

Що нового у версії 2.3:

Особливості додав:
При пошуку дітей, lxml.objectify приймає '{} тег "в тому сенсі, порожній простір імен, на відміну від батьківського простору імен.
Виправлені помилки:
Після прочитання з файлового об'єкта, як, аналізатор негайно викликає його метод .close ().
Після завершення розбору, iterparse () відразу закриває вхідний файл.
Робота навколо для libxml2 помилка, яка може залишити HTML парсер в не-функціонального стану після розбору severly зламаною документ (фіксований в libxml2 2.7.8).
Марк тег в HTML код очистки названий правильно намет.
Інші зміни:
Деякі державні функції в Cython рівня C-API є більш чіткі типи повернення.

Що нового у версії 2.3beta1:

Виправлені помилки:
Збій в нових версіях libxml2 при переміщенні елементів між документами, які мали атрибути замінені вузлів XInclude.
функція XMLID () не вистачає додаткові аналізатора і base_url параметрів.
Пошук шаблонних тегів у iterparse () була порушена в PY3.
lxml.html.open_in_browser () не працює в Python 3 у зв'язку з використанням os.tempnam. Це в даний час займає додатковий параметр '' кодування.

12 May 15 в модулі, пітон модулі

lxml

Пошук за категоріями

lxml

Схожі програми

QuoteOfTheDay

configs

py-bcrypt

vatnumber

lxml

Коментар не знайдено

додати коментар

Пошук за категоріями

Пошук за категоріями

Популярні програми

RS Head Cleaner 1 Oct 15

JCK Editor 1 Mar 15

Naked 12 Apr 15

JW Player for Flash & HTML5 Video 4 Jun 15

WP JW Player 6 Jun 15

Captcha 6 Mar 16

configs 1 Mar 15

lxml

Схожі програми

QuoteOfTheDay

configs

py-bcrypt

vatnumber

lxml

Коментар не знайдено

додати коментар

Пошук за категоріями

Популярні програми

Hello Emoji 13 May 15

JW Player for Flash & HTML5 Video 4 Jun 15

pyficache 28 Feb 15

Booking Calendar 21 Jul 15

Image-Size 12 Apr 15

JCK Editor 1 Mar 15

CKEditor for Joomla 12 May 15