პროგრამა html ტეგების მოსაშორებლად. HTML კოდის გაწმენდა MS Word-დან HTML5 WYSIWYG რედაქტორში ტექსტის ჩასმისას (საჭიროა)

18.10.2023

კარგი დღე, ძვირფასო მკითხველებო! იმედი მაქვს, თქვენც ისევე კარგად ხართ, როგორც ჩვენ - მზე ანათებს, ჩიტები მღერიან, თბილია და ზაფხული დადგა! ამჟამად ვმუშაობ დისერტაციაზე, ამიტომ ბოლო თვენახევარია ვწერ კვირაში მხოლოდ ერთხელ, ფიზიკურად დრო არ მაქვს. ოღონდ სამწუხარო რაღაცეებზე ნუ ვილაპარაკებთ, საქმეს მივუდგეთ!

ოდესღაც ინტერნეტში ვთხრიდი, რომ მეპოვა სკრიპტი, რომელიც ასუფთავებს HTML კოდს ნაგვისგან, რაც, კერძოდ, ყველას გვიტოვებს „საყვარელთან“ ამ მხრივ. Microsoft Word. ადრე ვიყენებდი კოდის გასუფთავება Adobe Dreamweaver-ის გამოყენებითმაგრამ მას ჰქონდა ორი ნაკლი:

    ზოგჯერ ის არ ასუფთავებს ყველაფერს, რაც ჩვენ გვსურს.

    ძალიან დიდი რაოდენობითგასუფთავების სკრიპტი იძლევა შეცდომას.

მეორე პუნქტი ჩემთვის კრიტიკული გახდა, რადგან მომიწია დიდთან მუშაობა html ცხრილები, საიდანაც შეუძლებელი იყო ერთი საიტიდან დაშორება და მათ ყველა ინფორმაცია Word-ში მიაწოდეს.

ამრიგად, ინტერნეტში დიდი ხნის განმავლობაში ხეტიალის შემდეგ, აღმოვაჩინე სკრიპტი, რომელიც უმკლავდება მთელ ამ მენეჯმენტს და ამავდროულად სრულიად კონფიგურირებადია.

გამარჯობა!

ჩემი WYSIWYG რედაქტორის დაწერისას, Word-დან ტექსტის კოპირების პრობლემა შემექმნა. სინამდვილეში სამი პრობლემაა:

  • Word ათავსებს უამრავ უსარგებლო მასალას html კოდირომელიც უნდა გაიწმინდოს
  • გარკვეული მიზეზების გამო, Word იყენებს აბზაცებს UL და LI ტეგების ნაცვლად სიების წარმოსაჩენად
  • სინამდვილეში, როგორ უნდა დადგინდეს, რომ ჩასმული ტექსტი ჩასმულია Word-იდან.
ზოგადად, ამ პრობლემების გადასაჭრელად დაიწერა jquery მოდული, სრული წყარო კოდირომელიც ხელმისაწვდომია სტატიის ბოლოს. გამოყენების მაგალითი:

$ ('#რედაქტორი'). msword_html_filter();
მოდული დაკიდებულია ღონისძიებაზე კლავიატურადა ამოწმებს, არის თუ არა ჩასმული წყაროს კოდი რედაქტორის შიგნით, თუ ასეა, მაშინ გასუფთავების ფუნქცია ამოქმედდება. ყველაფერი რაც შესაძლებელია შედის html-ში - უწყვეტი სივრცეები, ატრიბუტები სტილიდა გასწორება, ტეგები სპანი, ყველა მსო-კლასები, ცარიელი აბზაცები.

განხორციელების დეტალები ჭრის ქვეშ.

გამოყენებული რეგულარების უმეტესობა აღებულია TinyMCE-დან.

როგორ განვსაზღვროთ, შეიცავს თუ არა ხაზს Word-დან ჩასმული html კოდი:

თუ (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w:WordDocument/i.test(content)) ( ... )

კოდის გაწმენდის ფუნქცია (jquery რედაქტორის ობიექტი გადაეცემა ფუნქციას):

ფუნქცია word_filter(რედაქტორი)( var content = editor.html(); // სიტყვების კომენტარები, როგორიცაა პირობითი კომენტარები და ა.შ. შინაარსი = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|მეტა|ლინკი|სტილი|\w:\w+)(?=[\s\/>]))[^>]* >>გი, ""); // კონვერტაცია <(\/?)s>შევიდა<$1strike> ___ /გი",<\/span>([\s\u00a0]*) /gi, ფუნქცია(str, spaces) ( return (spaces.length > "; if (/^\s*\w+\./.test(txt)) ( var ემთხვევა = /()\./.exec(txt if (შეესაბამება) ( var start = parseInt( matches, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level>);" + $(this).html() + "

") $(this).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", რედაქტორი).removeAttr("სტილი"); $("", რედაქტორი).removeAttr( "align" $("span", editor).replaceWith(function() (return $(this).contents();)); , რედაქტორი).removeAttr("კლასი"); მოდულის სრული წყაროს ტექსტი არის სპოილერის ქვეშ, შეინახეთ ფაილში

jquery.msword_html_filter.js

მოდულის წყაროს ტექსტი(ფუნქცია($) ( $.fn.msword_html_filter = ფუნქცია(ოფციები) ( var პარამეტრები = $.extend((), ოფციები); ფუნქცია word_filter(editor)( var content = editor.html(); // Word კომენტარები, როგორიცაა პირობითი კომენტარები და ა.შ. შინაარსი = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|მეტა|ლინკი|სტილი|\w:\w+)(?=[\s\/>]))[^>]* >>გი, ""); // კონვერტაცია /gi, "");<(\/?)s>შევიდა<$1strike>// წაშალეთ კომენტარები, სკრიპტები (მაგ., msoShowComment), XML ტეგი, VML შინაარსი, // MS Office სახელების სივრცის ტეგები და რამდენიმე სხვა ტეგი content = content.replace(/ ___ for line-tough content = content.replace(/ /გი",<\/span>"); // ჩაანაცვლეთ nbsp ერთეულები char-ზე, რადგან მისი დამუშავება უფრო ადვილია //content = content.replace(/ /gi, "\u00a0"); /gi, ფუნქცია(str, spaces) ( return (spaces.length > "; if (/^\s*\w+\./.test(txt)) ( var ემთხვევა = /()\./.exec(txt if (შეესაბამება) ( var start = parseInt( matches, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level>);") $(this).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", რედაქტორი).removeAttr("სტილი"); $("", რედაქტორი).removeAttr( "align" $("span", editor).replaceWith(function() (return $(this).contents();)); , editor).removeAttr("class")$("p:empty", editor).remove( return this.each(function() ($(this).on("keyup", function ()); var content = $(this).html( if (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w :WordDocument/ i.test(შინაარსი)) (word_filter($(this)); ) ));


შესრულება შემოწმდა მხოლოდ უახლეს Firefox-ში.

მოიშორეთ თქვენი ბინძური მარკირება უფასო ონლაინ HTML Cleaner-ით. ძალიან მარტივია ვებ კოდის შედგენა, რედაქტირება, ფორმატირება და მინიფიცირება ამ ონლაინ ხელსაწყოთი. გადაიყვანეთ Word დოკუმენტები მოწესრიგებულ HTML-ში და ნებისმიერ სხვა ვიზუალურ დოკუმენტში, როგორიცაა Excel, PDF, Google Docs და ა.შ. ძალიან მარტივი და ეფექტურია მუშაობა ორ თანდართულ ვიზუალურ და წყაროს რედაქტორთან, რომელიც მყისიერად რეაგირებს თქვენს ქმედებებზე.

HTML Cleaner აღჭურვილია მრავალი სასარგებლო ფუნქციით, რათა HTML გაწმენდა და რედაქტირება მაქსიმალურად გაადვილდეს. უბრალოდ ჩასვით თქვენი კოდი ტექსტის ზონაში, დააყენეთ დასუფთავების პარამეტრები და დააჭირეთ გაასუფთავეთ HTMLღილაკი. მას შეუძლია გაუმკლავდეს Microsoft Excel-ით, PowerPoint-ით, Google Docs-ით ან ნებისმიერი სხვა კომპოზიტორით შექმნილ ნებისმიერ დოკუმენტს. ეს გეხმარებათ მარტივად მოიცილოთ ყველა შიდა სტილი და არასაჭირო კოდი, რომლებიც დამატებულია Microsoft Word-ის ან სხვა WYSIWYG რედაქტორების მიერ. ეს HTML რედაქტორის ხელსაწყო სასარგებლოა, როდესაც თქვენ ახორციელებთ კონტენტის მიგრაციას ერთი ვებსაიტიდან მეორეზე და გსურთ გაასუფთავოთ ყველა უცხო კლასი და ID, სადაც გამოიყენება საწყისი საიტი. გამოიყენეთ პოვნა და ჩანაცვლების ინსტრუმენტი თქვენი მორგებული ბრძანებებისთვის. უაზრო ტექსტის გენერატორი საშუალებას გაძლევთ მარტივად დაამატოთ მოტყუებული ტექსტი რედაქტორში.

გვერდის ზედა ნაწილში შეგიძლიათ იხილოთ ვიზუალური რედაქტორი და წყაროს კოდის რედაქტორი ერთმანეთის გვერდით. რომელი შეცვალოთ ცვლილებები რეალურ დროში აისახება მეორეზე. ვიზუალური HTML რედაქტორი დამწყებთათვის საშუალებას აძლევს ადვილად შეადგინონ თავიანთი შინაარსი, ისევე, როგორც ნებისმიერი სხვა სიტყვების დამმუშავებელი პროგრამის გამოყენებისას, ხოლო მარჯვნივ, წყაროს რედაქტორი ხაზგასმული კოდის მარკირებით ეხმარება მოწინავე მომხმარებლებს კოდის კორექტირებაში. ეს ხდის ამ ონლაინ პროგრამას მშვენიერ ინსტრუმენტად HTML კოდირების შესასწავლად.

Word დოკუმენტების კონვერტაცია HTML-ის გასასუფთავებლად

ონლაინ PDF-ების, Microsoft Word-ის, Excel-ის, PowerPoint-ის ან ნებისმიერი სხვა დოკუმენტის გამოსაქვეყნებლად, რომელიც შედგენილია სხვადასხვა სიტყვის რედაქტორის პროგრამით, ან უბრალოდ სხვა ვებსაიტიდან კოპირებული კონტენტის დასაკოპირებლად, ჩასვით ფორმატირებული შინაარსი ვიზუალურ რედაქტორში. დოკუმენტის HTML წყარო დაუყოვნებლივ გამოჩნდება წყაროს რედაქტორშიც. WYSIWYG რედაქტორის ზემოთ საკონტროლო ზოლი აკონტროლებს ამ ველს, ხოლო წყაროს დასუფთავების ყველა სხვა პარამეტრი არის წყაროს კოდის რედაქტირებისთვის. დააწკაპუნეთ გაასუფთავეთ HTMLღილაკი დასუფთავების პარამეტრების დაყენების შემდეგ. დააკოპირეთ გასუფთავებული კოდი და გამოაქვეყნეთ იგი თქვენს ვებგვერდზე.

არ არსებობს გარანტია, რომ პროგრამა ასწორებს თქვენს კოდში არსებულ ყველა შეცდომას ზუსტად ისე, როგორც თქვენ გსურთ, ამიტომ გთხოვთ, შეიყვანოთ სინტაქსურად მოქმედი HTML.

გადაიყვანეთ HTML ცხრილები სტრუქტურირებულ div ელემენტებად შესაბამისი ჩამრთველის გააქტიურებით.

გაწმინდეთ HTML კოდი Microsoft Word-ის ტეგებიდან (2000-2007)?

წარსულში ვებ დიზაინერები ქმნიდნენ თავიანთ ვებსაიტებს ცხრილების გამოყენებით გვერდის განლაგების ორგანიზებისთვის, მაგრამ საპასუხო ვებ დიზაინის ეპოქაში ცხრილები მოძველებულია და მათ ადგილს იკავებს DIV. ეს ონლაინ ინსტრუმენტი დაგეხმარებათ გადააქციოთ თქვენი ცხრილები სტრუქტურირებულ div ელემენტებად რამდენიმე მარტივი დაწკაპუნებით.

თქვენ შეგიძლიათ გახადოთ თქვენი საწყისი კოდი უფრო იკითხებადი ჩანართების იერარქიის ხის ხედში ორგანიზებით.

გახდი წევრი

ეს ვებსაიტი არის სრულად ფუნქციონალური ინსტრუმენტი HTML კოდის გასასუფთავებლად და შედგენისთვის, მაგრამ თქვენ გაქვთ შესაძლებლობა შეიძინოთ HTML G წევრობა და მიიღოთ წვდომა კიდევ უფრო პროფესიონალურ ფუნქციებზე. HTML Cleaner-ის უფასო ვერსიის გამოყენებით, თქვენ ეთანხმებით, რომ შეიტანოთ ბმულები რედაქტირებულ დოკუმენტებში. ამ დასუფთავების ხელსაწყოს შეუძლია დაამატოს სარეკლამო მესამე მხარის ბმული გასუფთავებული დოკუმენტების ბოლოს და თქვენ უნდა დატოვოთ ეს კოდი უცვლელი მანამ, სანამ იყენებთ უფასო ვერსიას.

Cleaner არის "ნაგვისგან" ტეგების გაწმენდის სერვისი, რომელიც რჩება დოკუმენტში პროგრამის ფორმატში გვერდის შენახვის შემდეგ.

დიდი ხნის წინ დავწერე მსგავსი დანამატი, მაგრამ ნაჩქარევად გაკეთდა, ახლა მექანიზმი მთლიანად გადაწერილია.

კოდის გაწმენდა ხდება შეყვანილი ხაზის ძიებით, საიდანაც იქმნება ახალი, რომელიც შეიცავს "სუფთა". მოდული შლის აბსოლუტურად ყველაფერს ტეგებიდან, მათ შორის. დაუწყვილებელ ტეგებში ჩასმულია სიმბოლო / (slash). ცარიელი ტეგები ამოღებულია, მაგალითად, კონსტრუქცია წაიშლება, რადგან არაფერს შეიცავს.

როგორ მუშაობს html გამწმენდი?

არსებობს ორი გზა:

  1. MS Word-ში აირჩიეთ მონაცემები, რომელთა გასუფთავებაც გსურთ, ყველა ასარჩევად დააჭირეთ Ctrl + A. ჩასვით კოპირებული ტექსტი ქვემოთ მოცემულ ველში (არჩეული უნდა იყოს ჩანართი „MS Office Data-ის ჩასმა“), დააწკაპუნეთ ღილაკზე „დასრულება“.
  2. კოდის ოპტიმიზაციამდე აირჩიეთ „შენახვა როგორც...“ Word-ში, შემდეგ აირჩიეთ ფაილის ტიპი „ვებ გვერდი ფილტრით“, შემდეგ გახსენით შენახული ფაილი ტექსტურ რედაქტორში, დააკოპირეთ კოდი და ჩასვით ქვემოთ მოცემულ ველში ( "HTML-ის ჩასმა" ჩანართი უნდა იყოს არჩეული "), დააჭირეთ ღილაკს "შესრულებულია".

შედეგად, თქვენ მიიღებთ ხელუხლებელი html კოდს.
შემდეგი ატრიბუტები ხელუხლებელი რჩება:

"colspan", "rowspan", "href", "src", "type", "value", "lang", "tabindex", "title", "code", "alt", "target", "dir ", "სპანი", "მოქმედება", "მეთოდი"

Excel/Word to HTML იდეალური ინსტრუმენტია WordPress-ის სტატიების წყაროს კოდის ან სხვა კონტენტის მართვის სისტემის რედაქტირებისთვის, როდესაც მათი ჩაშენებული კომპოზიტორი არ უზრუნველყოფს ყველა ჩვენთვის საჭირო ფუნქციას. შეადგინეთ შინაარსი პირდაპირ თქვენი ბრაუზერის ფანჯარაში გაფართოების ან დანამატის დაყენების გარეშე სინტაქსის ხაზგასმისა და ტექსტის რედაქტირების სხვა ფუნქციების დასამუშავებლად.

როგორ გამოვიყენოთ?

ჩასვით დოკუმენტი, რომლის კონვერტაციაც გსურთ Word რედაქტორში, შემდეგ გადადით HTML მაყურებელზე გვერდის ზედა დიდი ჩანართების გამოყენებით კოდის გენერირებისთვის.

გაასუფთავეთ ბინძური მარკირება დიდი ღილაკით, რომელიც ახორციელებს აქტიურ (შემოწმებულ) ვარიანტებს სიაში. თქვენ ასევე შეგიძლიათ გამოიყენოთ ეს ფუნქციები სათითაოდ CLEAN ხატულას გამოყენებით.

კონვერტაციის პრობლემები, რომლებიც ადვილად გვარდება ჩვენი ონლაინ HTML კონვერტორის მიერ

სიტყვის html-ად გადაქცევის პრობლემა, ალბათ, ყოველთვის არსებობდა Microsoft Word-თან ერთად. ტექსტებისთვის მინიჭებული სტილის დიდი რაოდენობა, როგორიცაა mso-spacerun:yes, და კლასები, როგორიცაა MsoNormal, ისევე როგორც ყველა სახის span style="font-size:10.0pt" არეულობა დიდად აფუჭებს კოდს. და ისინი ხშირად წყვეტენ საიტზე მითითებულ მშობლიურ სტილებს. თუ თქვენ მაინც შეძლებთ მარტივი ტექსტის დამუშავებას რედაქტორის "მხოლოდ ტექსტის ჩასმა" ღილაკის მეშვეობით ტექსტის ჩასმით, მაშინ ეს მეთოდი არ იმუშავებს ცხრილებთან. ჩვენს კონვერტორს შეუძლია მარტივად გაასუფთავოს ნებისმიერი არასაჭირო კომენტარი და სტილი მომავალი html ფაილიდან, უბრალოდ ღილაკებზე დაწკაპუნებით.


HTML-ის ონლაინ გაწმენდა არასაჭირო CSS სტილისგან
  • წაშალეთ ნებისმიერი არასაჭირო სტილი ყველა ტექსტიდან ან შერჩეული ფრაგმენტიდან
  • ჩვენ ვხსნით არასაჭირო შეწევის კოდებს, სიმბოლოებს და სხვა Unicode კოდებს
  • გაასუფთავეთ კოდი დამატებითი სივრცეებიდან და დუბლიკატი ტეგებისგან
  • საჭიროების შემთხვევაში, მთლიანად წაშალეთ HTML მარკირება.

გადაიყვანეთ Word, Excel, TxT ფაილები სუფთა HTML კოდით. საიტის გვერდებზე პირდაპირი, სწორი ჩასართავად ზედმეტი სტილისა და კომენტარების გარეშე.

მხარდაჭერილი ფორმატები ონლაინ კონვერტაციისთვის:

  • 97–2004 და უფრო ახალი DOC HTML, DOCX HTML;
  • XLS HTML-მდე, XLSX-დან HTML-მდე;
  • PPT HTML-მდე, PPTX HTML-მდე;
  • TXT to HTML და მრავალი სხვა ფორმატი.

სერვისის კიდევ ერთი სასარგებლო გამოყენება, იმის ნაცვლად, რომ საათები დახარჯოთ ცხრილის HTML-ში შედგენაში, შექმენით იგი 15 წუთში Excel-ში ან Word-ში და გადააქციეთ სუფთა, ლამაზ HTML კოდში საიტზე ჩასართავად.