Html teqləri silmək üçün proqram. MS Word-dən HTML5 WYSIWYG redaktoruna mətn daxil edərkən HTML kodunun təmizlənməsi (məzmunlu)

18.10.2023

Gününüz xeyir, əziz oxucular! Ümid edirəm ki, siz də bizim kimi işləyirsiniz - günəş parlayır, quşlar oxuyur, isti və yay gəldi! Hazırda dissertasiyam üzərində işləyirəm, ona görə də son ay yarımdır ki, həftədə yalnız bir dəfə yazıram, fiziki olaraq vaxtım yoxdur. Ancaq kədərli şeylərdən danışmayaq, işə başlayaq!

Bir vaxtlar HTML kodunu zibildən təmizləyən bir skript tapmaq üçün İnternetdə qazıntılar aparırdım, xüsusən də bu mövzuda hamımızı "sevgilim" ilə tərk edir. Microsoft Word. Əvvəllər istifadə edirdim Adobe Dreamweaver istifadə edərək kodun təmizlənməsi amma var idi iki çatışmazlıq:

    Bəzən istədiyimiz hər şeyi təmizləmir.

    Çox böyük miqdarda Təmizləmə skripti xəta verir.

İkinci məqam mənim üçün kritik oldu, çünki böyüklərlə işləməli oldum html cədvəlləri, oradan bir saytdan uzaqlaşmaq mümkün deyildi və bütün məlumatları Word-də təqdim etdilər.

Beləliklə, uzun müddət İnternetdə dolaşdıqdan sonra bütün bu idarəetmə ilə bir partlayışla öhdəsindən gələn və eyni zamanda tamamilə fərdiləşdirilə bilən bir skript tapdım.

salam!

Öz WYSIWYG redaktorumu yazarkən Word-dən mətni köçürərkən problemlə qarşılaşdım. Əslində üç problem var:

  • Word çoxlu zibil daxil edir html kodu ki, təmizlənməlidir
  • Nədənsə Word siyahıları təqdim etmək üçün UL və LI teqləri əvəzinə paraqraflardan istifadə edir
  • Əslində, daxil edilmiş mətnin Word-dən daxil edildiyini necə müəyyən etmək olar.
Ümumiyyətlə, bu problemlərin həlli üçün jQuery plagini yazıldı, tamamlandı mənbə kodu məqalənin sonunda mövcuddur. İstifadə nümunəsi:

$('#redaktor'). msword_html_filter();
Plugin tədbirdə asılıb keyup və redaktorun içindəki mənbə kodunun Word-dən yapışdırılıb-yapışdırılmadığını yoxlayır, əgər varsa, təmizləmə funksiyası işə salınır; Mümkün olan hər şey nəticədə html daxil edilir - qırılmayan boşluqlar, atributlar üslubhizalayın, etiketlər aralıq, Hamısı Mso-siniflər, boş paraqraflar.

Kəsmə altındakı icra detalları.

İstifadə olunan müntəzəmlərin əksəriyyəti TinyMCE-dən götürülüb.

Sətirdə Word-dən daxil edilmiş html kodunun olub olmadığını necə müəyyən etmək olar:

Əgər (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w:WordDocument/i.test(content)) ( ... )

Kod təmizləmə funksiyası (jQuery redaktoru obyekti funksiyaya ötürülür):

Funksiya word_filter(redaktor)( var content = editor.html(); // Şərti şərhlər və s. kimi Word şərhləri məzmun = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|meta|link|style|\w:\w+)(?=[\s\/>]))[^>]* >>gi, ""); // Çevir <(\/?)s>daxil<$1strike> ___ /gi,"<\/span>([\s\u00a0]*) /gi, funksiya(str, boşluqlar) ( qaytarmaq (boşluqlar.uzunluq > "; əgər (/^\s*\w+\./.test(txt)) ( var uyğun gəlir = /()\./.exec(txt) if (uyğunlaşır) ( var start = parseInt(matches, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level>" + $(bu).html() + "

") $(this).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", redaktor).removeAttr("style"); $("", redaktor).removeAttr( "align"); $("span", redaktor).replaceWith(function() (qaytar $(this).contents();));Remove("); , redaktor).removeAttr("sinif"); $("p:boş", redaktor).remove(); Pluginin tam mənbə mətni spoylerin altındadır, faylda saxlayın

jquery.msword_html_filter.js

plugin mənbə mətni(funksiya($) ( $.fn.msword_html_filter = funksiya(seçimler) ( var parametrlər = $.extend((), seçimlər); funksiya word_filter(redaktor)( var content = editor.html(); // Word kimi şərhlər şərti şərhlər və s. məzmun = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|meta|link|style|\w:\w+)(?=[\s\/>]))[^>]* >>gi, ""); // Çevir /gi, "");<(\/?)s>daxil<$1strike>// Şərhləri, skriptləri (məsələn, msoShowComment), XML teqi, VML məzmunu, // MS Office ad boşluqlu teqləri və bir neçə digər teqləri silin content = content.replace(/ ___ sətirli məzmun üçün = content.replace(/ /gi,"<\/span>"); // nbsp elementlərini char ilə əvəz edin, çünki idarə etmək daha asandır //content = content.replace(/ /gi, "\u00a0"); /gi, funksiya(str, boşluqlar) ( qaytarmaq (boşluqlar.uzunluq > "; əgər (/^\s*\w+\./.test(txt)) ( var uyğun gəlir = /()\./.exec(txt) if (uyğunlaşır) ( var start = parseInt(matches, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level>") $(this).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", redaktor).removeAttr("style"); $("", redaktor).removeAttr( "align"); $("span", redaktor).replaceWith(function() (qaytar $(this).contents();));Remove("); , redaktor).removeAttr("class"); $("p:boş", redaktor).remove(); var content = $(this).html(); if (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w :WordDocument/ i.test(məzmun)) ( word_filter($(bu)); ) ));


Performans yalnız ən son Firefox-da sınaqdan keçirilmişdir.

Pulsuz onlayn HTML Təmizləyicisi ilə çirkli işarələmədən xilas olun. Bu onlayn alətlə veb kodunu tərtib etmək, redaktə etmək, formatlaşdırmaq və kiçiltmək çox asandır. Word sənədlərini səliqəli HTML və Excel, PDF, Google Sənədlər və s. kimi hər hansı digər vizual sənədlərə çevirin. Hərəkətlərinizə dərhal cavab verən iki əlavə vizual və mənbə redaktoru ilə işləmək son dərəcə sadə və səmərəlidir.

HTML Cleaner HTML təmizləmə və redaktəni mümkün qədər asanlaşdırmaq üçün bir çox faydalı xüsusiyyətlərlə təchiz edilmişdir. Sadəcə kodunuzu mətn sahəsinə yapışdırın, təmizləmə seçimlərini qurun və düyməsini basın Təmiz HTML düyməsi. O, Microsoft Excel, PowerPoint, Google sənədləri və ya hər hansı digər bəstəkar ilə yaradılmış istənilən sənədi idarə edə bilər. Bu, Microsoft Word və ya digər WYSIWYG redaktorları tərəfindən əlavə edilən bütün daxili üslublardan və lazımsız kodlardan asanlıqla xilas olmağa kömək edir. Bu HTML redaktoru aləti məzmunu bir veb-saytdan digərinə köçürərkən və mənbə saytının tətbiq etdiyi bütün yad sinifləri və identifikatorları təmizləmək istədiyiniz zaman faydalıdır. Fərdi əmrləriniz üçün tap və dəyişdir alətindən istifadə edin. Cəlbedici mətn generatoru sizə redaktora asanlıqla saxta mətn əlavə etməyə imkan verir.

Səhifənin yuxarı hissəsində vizual redaktoru və mənbə kodu redaktorunu bir-birinin yanında görə bilərsiniz. Hansı dəyişdirsəniz, dəyişikliklər real vaxtda digərində əks olunacaq. Vizual HTML redaktoru yeni başlayanlara hər hansı digər mətn prosessor proqramından istifadə edərkən olduğu kimi asanlıqla məzmunu tərtib etməyə imkan verir, sağ tərəfdə isə vurğulanmış kod işarəsi olan mənbə redaktoru qabaqcıl istifadəçilərə kodu tənzimləməyə kömək edir. Bu, bu onlayn proqramı HTML kodlamasını öyrənmək üçün gözəl bir vasitədir.

Təmiz HTML üçün Word sənədlərini çevirin

Onlayn PDF, Microsoft Word, Excel, PowerPoint və ya müxtəlif söz redaktoru proqramları ilə tərtib edilmiş hər hansı digər sənədləri dərc etmək və ya sadəcə başqa veb-saytdan kopyalanan məzmunu köçürmək üçün formatlaşdırılmış məzmunu vizual redaktora yapışdırın. Sənədin HTML mənbəyi də mənbə redaktorunda dərhal görünəcək. WYSIWYG redaktorunun üstündəki idarəetmə paneli bu sahəyə nəzarət edir, bütün digər mənbə təmizləmə parametrləri mənbə kodunu redaktə etmək üçündür. üzərinə klikləyin Təmiz HTML təmizləmə seçimlərini qurduqdan sonra düyməsini basın. Təmizlənmiş kodu kopyalayın və veb saytınızda dərc edin.

Proqramın kodunuzdakı bütün səhvləri istədiyiniz şəkildə düzəldəcəyinə zəmanət yoxdur, ona görə də sintaktik olaraq etibarlı HTML daxil etməyə çalışın.

HTML cədvəllərini müvafiq qeyd qutusunu aktivləşdirərək strukturlaşdırılmış div elementlərinə çevirin.

Microsoft Word teqlərindən HTML kodunu təmizləmək (2000-2007)?

Keçmişdə veb-dizaynerlər səhifə tərtibatını təşkil etmək üçün cədvəllərdən istifadə edərək veb saytlarını qururdular, lakin həssas veb dizayn dövründə cədvəllər köhnəlib və DIV-lər onların yerini tutur. Bu onlayn alət bir neçə sadə kliklə cədvəllərinizi strukturlaşdırılmış div elementlərinə çevirməyə kömək edir.

Nişanlar iyerarxiyasını ağac görünüşündə təşkil etməklə mənbə kodunuzu daha oxunaqlı edə bilərsiniz.

Üzv olun

Bu veb-sayt HTML kodunu təmizləmək və tərtib etmək üçün tam funksional vasitədir, lakin sizin HTML G üzvlüyü almaq və daha peşəkar funksiyalara daxil olmaq imkanınız var. HTML Təmizləyicisinin pulsuz versiyasından istifadə edərək, redaktə edilmiş sənədlərə keçidlərin daxil edilməsinə razılıq verirsiniz. Bu təmizləmə aləti təmizlənmiş sənədlərin sonuna reklam xarakterli üçüncü tərəf linki əlavə edə bilər və siz pulsuz versiyadan istifadə etdiyiniz müddətdə bu kodu dəyişməz saxlamalısınız.

Təmizləyici, səhifəni proqramdan formatda saxladıqdan sonra sənəddə qalan etiketləri "zibildən" təmizləmək üçün bir xidmətdir.

Uzun müddət əvvəl oxşar bir plagin yazdım, amma tələsik hazırlanmışdı, indi mexanizm tamamilə yenidən yazılmışdır.

Kodun təmizlənməsi, "təmiz" olan yenisinin yaradıldığı daxil edilmiş sətirdə axtarış etməklə baş verir. Plugin etiketlərdən tamamilə hər şeyi, o cümlədən . Qoşalaşdırılmamış teqlərdə / (slash) simvolu daxil edilir. Boş teqlər silinir, məsələn konstruksiya heç bir şey olmadığı üçün silinəcək.

Html təmizləyicisi necə işləyir?

İki yol var:

  1. MS Word-də təmizləmək istədiyiniz məlumatları seçin, hamısını seçmək üçün Ctrl + A düymələrini basın. Kopyalanan mətni aşağıdakı sahəyə yapışdırın ("MS Office Datasını Yapışdır" nişanı seçilməlidir), "Bitir" düyməsini basın.
  2. Kodu optimallaşdırmadan əvvəl Word-də “Fərqli saxla...” seçin, sonra “Filtrli veb səhifə” Fayl növünü seçin, sonra saxlanmış faylı mətn redaktorunda açın, kodu kopyalayın və aşağıdakı sahəyə yapışdırın ( "HTML daxil et" nişanı seçilməlidir "), "Bitti" düyməsini basın.

Nəticədə təmiz html kodu alacaqsınız.
Aşağıdakı atributlar toxunulmaz olaraq qalır:

"colspan", "rowspan", "href", "src", "type", "value", "lang", "tabindex", "title", "code", "alt", "target", "dir" ", "span", "fəaliyyət", "metod"

Excel/Word to HTML, daxili bəstəkar bizə lazım olan bütün funksiyaları təmin etmədikdə, WordPress məqalələrinin və ya hər hansı digər məzmun idarəetmə sisteminin mənbə kodunu redaktə etmək üçün ideal vasitədir. Sintaksis işıqlandırma və digər mətn redaktə xüsusiyyətlərini idarə etmək üçün genişləndirmə və ya plagin quraşdırmadan birbaşa brauzerinizin pəncərəsində məzmun yaradın.

Necə istifadə etməli?

Çevirmək istədiyiniz sənədi Word redaktoruna yapışdırın, sonra kodu yaratmaq üçün səhifənin yuxarısındakı böyük nişanlardan istifadə edərək HTML görüntüləyicisinə keçin.

Siyahıda aktiv (yoxlanmış) seçimləri yerinə yetirən böyük düymə ilə çirkli işarələməni təmizləyin. Siz həmçinin TƏMİZƏ ikonasından istifadə edərək bu funksiyaları bir-bir tətbiq edə bilərsiniz.

Onlayn HTML çeviricimiz tərəfindən asanlıqla həll olunan çevirmə problemləri

Sözü html-ə çevirmək problemi yəqin ki, Microsoft Word ilə birlikdə həmişə mövcud olub. Mso-spacerun:yes kimi mətnlərə təyin edilmiş çoxlu sayda üslub və MsoNormal kimi siniflər, eləcə də bütün növ span style="font-size:10.0pt" qarışıqlığı kodu böyük dərəcədə qarışdırır. Və onlar tez-tez saytda göstərilən yerli üslubları kəsirlər. Əgər siz hələ də redaktorun “Yalnız mətn daxil et” düyməsi vasitəsilə mətn daxil etməklə sadə mətni idarə edə bilirsinizsə, onda bu üsul cədvəllərlə işləməyəcək. Konvertorumuz sadəcə düymələrə basmaqla istənilən lazımsız şərhləri və üslubları gələcək html faylından asanlıqla təmizləyə bilir.


HTML-nin lazımsız CSS üslublarından onlayn təmizlənməsi
  • Bütün mətndən və ya seçilmiş fraqmentdən lazımsız üslubları silin
  • Biz lazımsız abzas kodlarını, simvolları və digər Unicode kodlarını silirik
  • Kodu əlavə boşluqlardan və dublikat etiketlərdən təmizləyin
  • Lazım gələrsə, HTML işarələməsini tamamilə silin.

Word, Excel, TxT fayllarını təmiz HTML koduna çevirin. Sayt səhifələrinə birbaşa, düzgün daxil etmək üçün lazımsız üslublar və şərhlər olmadan.

Onlayn çevirmə üçün dəstəklənən formatlar:

  • 97–2004 və daha yeni DOC - HTML, DOCX - HTML;
  • XLS-dən HTML-ə, XLSX-dən HTML-yə;
  • PPT-dən HTML-ə, PPTX-dən HTML-yə;
  • TXT-dən HTML-ə və bir çox başqa formatlara.

Xidmətdən başqa bir faydalı istifadə, HTML-də cədvəl hazırlamaq üçün saatlar sərf etmək əvəzinə, onu Excel və ya Word-də 15 dəqiqəyə hazırlayın və sayta daxil etmək üçün onu təmiz, gözəl HTML koduna çevirin.