Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Προγραμματισμός Υπολογιστών Γλώσσες

Ο κώδικας για Strip κεφαλίδες και υποσέλιδα από HTML αρχεία

Η δομή και η σύνταξη του HyperText Markup Langauge ή HTML , δεν λέει μόνο ένα πρόγραμμα περιήγησης στο Web πώς να εμφανίσετε τα περιεχόμενα ενός αρχείου , αλλά και καθορίζει τις διαρθρωτικές στοιχεία για το ίδιο το αρχείο . Αυτές οι ετικέτες είναι επίσης ανεκτίμητη, αν είστε ένας προγραμματιστής που κοιτάζουν για να φτιάξετε ένα πρόγραμμα που θα εξαλείψει συγκεκριμένα τμήματα ενός αρχείου HTML , όπως κεφαλίδα και το υποσέλιδο της . HTML Ανατομία
Η

HTML χρησιμοποιεί ένα απλό σύστημα επισήμανσης ετικετών για τον εντοπισμό διαφορετικά τμήματα ενός εγγράφου HTML . Κεφαλίδα του αρχείου HTML είναι χαρακτηρίζεται από την « " ετικέτα , το υποσέλιδο από την ετικέτα

. Ένας αναγνώστης HTML θα ερμηνεύσει οτιδήποτε μεταξύ της ετικέτας ανοίγματος και την ετικέτα που δείχνει κλείσιμο του τμήματος , " με "
, " ως μέρος της ενδεικνυόμενης τμήματος . Άλλες ετικέτες , όπως " " αντιστοιχούν σε άλλα στοιχεία του φακέλου .
Εικόνων Προσδιορισμός Κεφαλίδες και υποσέλιδα
Η

Όταν δημιουργείτε κώδικα για να αφαιρέσει μακριά κεφαλίδες και τα υποσέλιδα HTML , δεν μπορείτε να βασιστείτε για να γνωρίζει ακριβώς πόσο καιρό η κεφαλίδα ή το υποσέλιδο θα είναι . Ενώ μερικοί κεφαλίδες και υποσέλιδα αποτελούνται από μια ενιαία γραμμή , θα μπορούσε να είναι πολύ μεγαλύτερο . Συνεπώς , ο κώδικας δεν μπορεί απλά αναζήτηση για το "

/
" ετικέτα , τότε το σύμβολο '\\ n' που δείχνει το τέλος μιας γραμμής . Όταν διαβάσετε το περιεχόμενο του αρχείου HTML είναι σε μια σειρά χαρακτήρων, θα πρέπει να προσδιορίσει τη θέση του δείκτη του πρώτου " <" της αρχικής ετικέτας καθώς και το "> " του τερματικού ετικέτα .
εικόνων
Εντοπισμός String Θέσεις
Η

δύο γλώσσες χαμηλού επιπέδου όπως η C και C υψηλού επιπέδου γλώσσες όπως Python και Ruby + + και έχουν μεθόδους για να σας βοηθήσει να εντοπίσετε τα στοιχεία του κειμένου μέσα σε ένα δεδομένο κορδόνι . Αυτές οι μέθοδοι θα επιστρέψει τη θέση του δείκτη του πρώτου χαρακτήρα του κειμένου που σας ενδιαφέρει . Όταν ζητάτε από τις αρχικές ετικέτες , αυτό θα σας δώσει το σημείο εκκίνησης για την αφαίρεση κειμένου . Όταν ψάχνετε το τερματικό ετικέτα , να θυμάστε ότι το σημείο που θέλετε είναι είτε έξι ( " " ) ή επτά ( "

" ) θέσεις μπροστά από τον αριθμό η μέθοδος παρέχει σας .
εικόνων Διαγράμμιση Κωδικός
Η

Μόλις έχετε τις θέσεις του δείκτη για την κεφαλίδα ή το υποσέλιδο τμήμα που θέλετε να καταργήσετε , μπορείτε να πάτε για να κάνει αυτό σε μία από τις δύο γενικές τρόπους . Η μία είναι να επικαλεσθεί τις κατάλληλες μεθόδους για να διαγράψετε τους χαρακτήρες μεταξύ του πρώτου και του τελευταίου δείκτη για το τμήμα . Αυτό θα τροποποιήσει άμεσα την αρχική σειρά . Μπορείτε επίσης να δημιουργήσετε μια νέα σειρά για τη δημιουργία δύο εκδόσεις του περιεχομένου του αρχείου HTML : το αρχικό αρχείο και μια έκδοση απογυμνωθεί από την κεφαλίδα και το υποσέλιδο κώδικα . Κάνετε αυτό με την απόδοση του περιεχομένου της αρχικής συμβολοσειράς μέχρι την αρχική θέση του δείκτη , και στη συνέχεια τα πάντα μετά την τελευταία θέση του δείκτη , με το νέο κορδόνι .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα