Дані програми:
Версія: 3.4.4 оновлений
Дата завантаження: 12 May 15
Ліцензія: Безкоштовно
Популярність: 245
LXML поєднує в собі швидкість цих бібліотек з простотою мови Python.
Сумісність з усіма версіями CPython від 2,4 до 3,2
Що нового У цьому випуску :.
- lxml.html.iterlinks Тепер повертає посилання всередині тегів мета оновлення.
- Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
- аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
- ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
- XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
- Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.
Що нового у версії 3.4.2:
- lxml.html.iterlinks тепер повертає посилання всередині мета оновити теги.
- Нова опція XMLParser collect_ids = False, щоб відключити створення ID хеш-таблиці. Це може істотно прискорити розбір документів з різними ідентифікаторами, які не використовуються.
- аналізатор використовує за-документа хеш-таблиці для ідентифікаторів XML. Це знижує навантаження на глобальну аналізатора Словнику і прискорює синтаксичнийаналіз для документів з різними ідентифікаторами.
- ElementTree.getelementpath (елемент) повертає структурну вираз ElementPath для даного елемента, який може бути використаний для пошуків надалі.
- XMLFILE () приймає новий аргумент пильну = True, щоб закрити файл (-як) об'єктів після написання ним. До XMLFILE () тільки закрив файл, якщо він відкритий його внутрішньо.
- Дозволити & Quot; ByteArray & Quot; типу для введення тексту ASCII.
Що нового у версії 3.3.2:
- Властивості резольвер і версія, а також методи set_element_class_lookup () і makeelement (), загинули від iterparse об'єктів.
- Примірники XMLSCHEMA, Schematron і RelaxNG НЕ очистити їх місцевий error_log перед запуском перевірки.
- lxml.doctestcompare переплутали і Quot; очікується і Quot; і & Quot; поточна & Quot; в значеннях атрибутів.
Що нового у версії 3.3.1:
- Виправлені помилки:
- документи розібрані з parser.feed () не вдалося знайти елементи під тегом ітерації.
- Будівництво в PyPy вдалося через відсутність підтримки PyUnicode_Compare () і PyByteArray _ * () в C-API PyPy в.
- Компіляція в MSVC не вдалося через відсутність & Quot; stdint.h & Quot; стандартний файл заголовка.
- iterparse () не розбереш специфікації префікс файлів.
Що нового у версії 3.3.0:
- Виправлені помилки:
- евристичний що відрізняє шляхи до файлів з URL, підтяглася виробляти менше помилкових негативів.
Що нового у версії 3.2.3:
- Виправлена підтримка Python 2.4, який загинув в 3.2 0,2.
Що нового у версії 3.2.1:
- Методи apply_templates () і process_children () з елементи розширення XSLT отримали два нових логічних варіантів elements_only і remove_blank_text, що відмовитися або всі рядки або пропусками лише рядки зі списку результатів.
Що нового у версії 3.2.0:
- Провідний пробіл може змінити поведінку рядка розбору функції в lxml.html.
- рядок розбору функції в lxml.html є більш надійними в умовах незвичайної змісту HTML як фреймів або відсутній теги тіла.
- помилки введення / виводу при спробі отримати доступ до файлів зі шляхами, які містять символи, відмінні від ASCII може підняти UnicodeDecodeError замість належним чином повідомлення про IOError.
- Розбір з в пам'яті рядки відключив доступ до мережі в парсер за замовчуванням, і зробив наступні спроби розбору з URL невдачу.
Що нового у версії 3.1.2:
- Передача атрибутів через простору імен-не знають API з саксофон міст (тобто handler.startElement () метод) не вдалося з TypeError.
- Виправлена помилка серіалізациі на виході XSLT при перетворенні результуюче дерево в рядок Unicode.
Що нового у версії 3.0.2:
- Виправлена помилка при завершенні роботи інтерпретатора, переключившись на Cython 0,17 0,3 для будівництва.
Що нового у версії 3.0:
- c14n дозволяє задати інклюзивних префікси, які будуть запропоновані до згори- Рівень протягом ексклюзивному серіалізациі.
- Початкова підтримка для будівництва в PyPy (через cpyext).
- Предмети DTD отримали API, який дозволяє доступ на читання до їхніх заяв.
- xpathgrep.py отримала підтримку для розбору рядка за рядком (наприклад з виходу GREP) і для оточуючих вихід з новою кореневої тег.
- E-завод в lxml.builder приймає підтипи відомих типів даних (наприклад, струнних підтипів) при будівництві елементи навколо них.
- Дерево ітерації і iterparse () з селективним аргументу тегом підтримує проходження набір тегів. Вузли дерева будуть повернуті ітераторів, якщо вони збігаються один з тегів.
Що нового у версії 2.3.5:
- Помилка при злитті текстові вузли в element.remove ( ).
- Збій у саксофон / цільової аналізатора при поданні порожній тип документа.
Що нового у версії 2.3.4:
- Помилка при побудові nsmap (властивість елемента) з порожній простір імен URI.
- Краш-за гонки стані, коли помилки (або користувача повідомлення) відбуваються під час обробки нарізного XSLT.
- таблицю стилів XSLT збірник може ігнорувати помилки компіляції.
Що нового у версії 2.3.3:
- Особливості додав:
- lxml.html.tostring () отримала нові можливості серіалізациі with_tail і DOCTYPE.
- Виправлені помилки:
- Виправлена помилка при використанні iterparse () для розбору HTML і проханням стартові події.
- Виправлена розбір більш селекторів в cssselect. Прогалини, перш ніж псевдо-елементів і псевдо-класів є значним, як це нащадок комбінатор. & Quot; E: псевдо-Quot; повинні розібрати само, як і Quot; E *: псевдо & Quot;, & Quot ні; E :. псевдо & Quot;
не «LI> lxml.html.diff більше не викликає виключення при ударі теги" IMG "атрибуту" SRC "без.
Що нового у версії 2.3.2:
- Особливості додав:
- lxml.objectify.deannotate () має логічне нових опцій cleanup_namespaces щодо усунення об'єктивувати оголошення просторів імен (і, як правило прибирати оголошення просторів імен) після видалення анотації типу.
- lxml.objectify свою функцію самостійно вкладений () отримала як копії etree.SubElement, щоб уникнути в іншому випадку надлишковий імпорт lxml.etree на стороні користувача.
- Виправлені помилки:
- Виправлена & Quot; нащадок & Quot; помилка в cssselect вдруге (після першої фіксації в LXML 2.3.1). Попередня зміна призвело до серйозного регресу продуктивності для основі XPath оцінки перекладного слова. Зверніть увагу, що це порушує використання деяких з згенерованих виразами XPath як шляхів місця розташування XSLT, які раніше працювали в 2.3.1.
- Виправлена розбір деяких селекторів в cssselect. Прогалини після комбінаторів і Quot; # & x3e; & Quot;, & Quot; + & Quot; і & Quot; ~ & Quot; тепер правильно ігноруватися. Раніше в був розібраний як нащадок комбінатора. Наприклад, & Quot; DIV & # x3e; .foo & Quot; був розібраний так само, як і Quot; СНУ & # x3e; * .foo & Quot; замість & Quot; DIV & # x3e; .foo & Quot ;.
Що нового у версії 2.3.1:
- Особливості додав:
- Нова опція kill_tags в lxml.html.clean видалити конкретні теги і їх вміст (тобто вся їх поддерево).
- pi.get () і pi.attrib на інструкцій з обробки розбору псевдо-атрибутів з текстового змісту інструкцій з обробки.
- lxml.get_include () повертає список включає шляхи, які можуть бути використані для складання зовнішнього коду C проти lxml.etree. Це спеціально обумовлено для статично пов'язаний LXML будує, коли код необхідно скомпілювати проти тих же версій файлів заголовка як LXML собі.
- Resolver.resolve_file () приймає додатковий параметр, який налаштовує close_file якщо (-як) об'єктний файл буде закритий після прочитання чи ні. За замовчуванням, файл буде закритий, а користувач не очікується, зберегти посилання на нього.
- Виправлені помилки:
- Прибирання HTML не видалити "дані:". Посилання
- Інтеграція html5lib парсер тепер використовує «офіційний» реалізацію в самій html5lib, що робить його роботу з новими випусками бібліотеки.
- В lxml.sax, endElementNS () може неправильно відкидати простий ім'я тега, коли відповідне стартове подія виводиться той же простий ім'я тега, щоб бути в просторі імен за замовчуванням.
- Коли відкрити файл-подібний об'єкт передається в розборі () або iterparse (), аналізатор більше не буде близько він після використання. Це повертається до зміни LXML 2.3, де всі файли будуть закриті. Це відповідальність користувачам правильно закрити (-подібних) об'єкт файлу, а також у випадках, про помилки.
- помилки твердження lxml.html.cleaner, коли відкидаючи елементи верхнього рівня.
- В lxml.cssselect, використовуйте XPath '// B' (скорочення від 'A / нащадок-або-сам :: вузол () / B') замість 'A / нащадок :: B' для CSS Селектор нащадків ("B"). Це робить кілька крайні випадки, щоб бути узгоджується з поведінкою селектора в WebKit і Firefox, і робить більше CSS вирази дійсних шляхів розташування (для використання в XSL: шаблон матчі).
- В lxml.html, не визначена і # x3c; опція & # x3e; теги більше не з'являються в зібраних значень форми.
- Додавання / видалення і # x3c; опція & # x3e; значення в / з множинного вибору поля форми правильно вибирає їх і знімає виділення їх.
- Інші зміни:
- Статичний будує можна вказати каталог для завантаження з опцією --download-реж.
Що нового у версії 2.3:
- Особливості додав:
- При пошуку дітей, lxml.objectify приймає '{} тег "в тому сенсі, порожній простір імен, на відміну від батьківського простору імен.
- Виправлені помилки:
- Після прочитання з файлового об'єкта, як, аналізатор негайно викликає його метод .close ().
- Після завершення розбору, iterparse () відразу закриває вхідний файл.
- Робота навколо для libxml2 помилка, яка може залишити HTML парсер в не-функціонального стану після розбору severly зламаною документ (фіксований в libxml2 2.7.8).
- Марк тег в HTML код очистки названий правильно намет.
- Інші зміни:
- Деякі державні функції в Cython рівня C-API є більш чіткі типи повернення.
Що нового у версії 2.3beta1:
- Виправлені помилки:
- Збій в нових версіях libxml2 при переміщенні елементів між документами, які мали атрибути замінені вузлів XInclude.
- функція XMLID () не вистачає додаткові аналізатора і base_url параметрів.
- Пошук шаблонних тегів у iterparse () була порушена в PY3.
- lxml.html.open_in_browser () не працює в Python 3 у зв'язку з використанням os.tempnam. Це в даний час займає додатковий параметр '' кодування.
Коментар не знайдено