मुझे स्थायी रूप से निम्न त्रुटि मिलती है:
यूनिकोडएन्कोड त्रुटि: 'ascii' कोडेक नहीं कर सकता सांकेतिक शब्दों में कहें यू '\ xe4' स्थिति 27: क्रमिक संख्या में नहीं (128)
मैंने पहले से ही कोशिश की
-
x.encode (" ("एस्सीआई", "अनदेखा")
-
x.encode ("utf-8")
-
x.decode (" हालांकि, कुछ नहीं काम करता है।
>आपको पता होना चाहिए कि स्रोत में यह एन्कोडिंग क्या है।
मुझे लगता है कि यह आईएसओ -8859-1 (यूरोपीय भाषाओं) है, जिस स्थिति में यह "ए" है, लेकिन आपको चाहिए चेक। यह भी साइरिलिक या यूनानी हो सकता है।
इस एन्कोडिंग में वर्णों की पूरी सूची देखें।
इस जानकारी का उपयोग करके, आप इसे परिवर्तित करने के लिए पायथन से पूछ सकते हैं: < P> पायथन 2.7 में
& gt; & gt; & gt; S = '\ xe4' & gt; & gt; & gt; T = s.decode ('iso-8859-1')> और gt; & gt; प्रिंट टी æ> & gt; & gt; सी में टी: ... प्रिंट ऑर्ड (सी) ... 228 & gt; & gt; & gt; यू = टी। कोड ('यूटीएफ -8')> और gt; & gt; & gt; प्रिंट यू एंडएडी & gt; & gt; सी के लिए बाइट्स (यू): ... प्रिंट ऑर्ड (सी) ... 195 164
स्ट्रिंग
t
आंतरिक रूप से आईएसओ -8859-1 में एन्कोडेड है पायथन में स्ट्रिंगu
आंतरिक रूप से यूटीएफ -8 में एन्कोड किया गया है, और उस वर्ण को यूटीएफ -8 में 2 बाइट्स लेता है। नोटिस भी यह किप्रिंट कोड> निर्देश "जानता है" इन भिन्न एन्कोडिंग को कैसे प्रदर्शित किया जाए।
Comments
Post a Comment