ကွန်ပျူတာများပရိုဂရမ်းမင်း

UTF-8 - character encoding

ယူနီကုဒ်နီးပါးအားလုံးကိုဇာတ်ကောင်စုံကိုထောက်ခံပါတယ်။ ယူနီကုဒ်တဲ့ character set ကုဒ်သွင်း၏အကောင်းဆုံးပုံစံကို UTF-8 encoding ဖြစ်ပါတယ်။ ဒါဟာ ASCII နှင့်အတူလိုက်ဖက်မှု, အအချက်အလက်များ၏ပုံပျက်မှခုခံ, အပြောင်းအလဲနဲ့၏ထိရောက်မှုနှင့်လွယ်ကူခြင်းထောက်ခံပါတယ်။ ဒါပေမယ့်ပထမဦးဆုံးပထမဦးဆုံးအမှုအရာတို့ကို။

coding ပုံစံ

ကွန်ပျူတာများနံပါတ်များကိုစိတ္တဇသင်္ချာအရာဝတ္ထုအဖြစ်သိုလှောင်မှုနဲ့ပုံသေ-size ကိုဒေတာကိုင်တွယ်၏ယူနစ်များ၏ပေါင်းစပ်အဖြစ်သာလုပ်ကိုင် - က byte နဲ့ 32-bit နဲ့စကားများ။ ဆက်သဖို့ဘယ်လိုဆုံးဖြတ်သည့်အခါ encoding စံအကောင့်သို့ဤယူရမယ် ဇာတ်ကောင်များအရေအတွက်။

ကွန်ပျူတာစနစ်များကိုမှာကိန်း 8 bits သည် (1 bytes), 16 သို့မဟုတ် 32-bits ၏မှတ်ဉာဏ်ဆဲလ်ထဲမှာသိမ်းထားတဲ့။ တစ်ခုချင်းစီကိုပုံစံမှတ်ဥာဏ်ဆဲလ်၏ sequence ကိုတစ်ဦးအထူးသဖြင့်သင်္ကေတမှသက်ဆိုင်ရာအနေနဲ့ integer ဖြစ်တဲ့အတွက်သောယူနီကုဒ် encoding က, သတ်မှတ်ပါတယ်။ စံခုနှစ်တွင်ယူနီကုဒ်စာလုံးများကို 8, 16 နဲ့ 32-bit နဲ့လုပ်ကွက် coding သုံးခုကွဲပြားခြားနားသောပုံစံများရှိပါတယ်။ ထို့ကြောင့်သူတို့ UTF-8, UTF-16 နဲ့ UTF-32 အဖြစ်လူသိများကြသည်။ အမည် UTF ယူနီကုဒ်ေူပာင်းလဲရေးကို Format ကိုဆိုလိုတာပါ။ encoding က၏သုံးပုံစံများကိုတစ်ခုချင်းစီတန်းတူကိုယ်စားပြုမှုယူနီကုဒ်ဇာတ်ကောင်အမျိုးမျိုးကိုပလီကေးရှင်းအားသာချက်များရှိပြီးဖြစ်ပါတယ်ဆိုလိုသည်။

ဒေတာကိုစာဝှက်စနစ်ဟာယူနီကုဒ်စံထဲမှာအားလုံးဇာတ်ကောင်ကိုကိုယ်စားပြုဖို့အသုံးပြုနိုင်ပါသည်။ ထို့ကြောင့်သူတို့က coding ၏ကွဲပြားခြားနားသောပုံစံများကိုသုံးပြီးအကြောင်းပြချက်အမျိုးမျိုးတို့အတွက်ဖြေရှင်းချက်မှအပြည့်အဝလိုက်ဖက်ဖြစ်ကြသည်။ တစ်ခုချင်းစီကိုနိုင်တဲ့ coding တည်ပြီးသတ်တယ်အချက်အလက်များ၏ဆုံးရှုံးမှုမရှိဘဲအခြားနှစ်ဦးကိုမဆိုသို့ကူးပြောင်းနိုင်ပါတယ်။

nenalozheniya နိယာမ

မဟုတ်တဲ့တစ်စိတ်တစ်ပိုင်းထပ်တူ၏အမြင်များတွင်ဖွံ့ဖြိုးပြီးအဆိုပါပုံစံများကိုယူနီကုဒ် encoding ကတစ်ခုချင်းစီ။ ဥပမာအားဖြင့်, Window-932 ကုဒ်၏တစ်ဦးသို့မဟုတ်နှစ်ဦးကို bytes ၏ဇာတ်ကောင်ဖြစ်ပေါ်လာသော။ အဆိုပါ sequence ကိုအရှည်ကိုပထမဦးဆုံးက byte ပေါ်တွင်မူတည်သည်, ဒါကြောင့်နှစ်ခု-byte နှင့်တစ်ခုတည်းက byte disjoint ၏စီးရီးအတွက်ဦးဆောင်က byte တန်ဖိုးများ။ သို့သော်တစ်ခုတည်းက byte နဲ့ကပ်တွယ်မှုကိုက byte sequence ကို၏တန်ဖိုးတိုက်ဆိုင်လိမ့်မည်။ ဤအကျင့်စရိုက်ရှာဖွေရေး: D (ကုဒ်နံပါတ် 44) ကမှားယွင်းစွာနှစ်ခု-byte ဇာတ်ကောင် "D:" (ကုဒ်နံပါတ် 84 44) ၏ sequence ကို၏ဒုတိယတစျပိုငျးကိုသို့ဝငျတှေ့နိုငျသောဥပမာကိုဆိုလိုသည်။ မှန်ကန်သောအရာ sequence ကိုထွက်ရှာရန်, အစီအစဉ်ကိုအကောင့်ထဲသို့ယခင် bytes ယူသင့်ပါတယ်။

ဦးဆောင်ခြင်းနှင့်ကပ်တွယ်မှုကို bytes ပွဲစဉ်လျှင်ထိုအခြေအနေရှုပ်ထွေးဖြစ်ပါတယ်။ ဤအမရေရာဒွိဟကိုဖယ်ရှားနိုင်ရန်အတွက်တစ်ပြောင်းပြန် lookup ပြုလုပ်နေစာသားဒါမှမဟုတ်ထူးခြားတဲ့ကုဒ် sequence ကို၏အစမရောက်မီဖြစ်လိမ့်မည်ဟုဆိုလိုသည်။ ဒါကမသာမတတ်နိုင်သောဖြစ်တယ်, ဒါပေမဲ့အပြည့်အဝကိုစာသားမှတစ်ဦးတည်းသာမှားယွင်းနေက byte ဖတ်လို့မရအောင်ဖြစ်လာခဲ့ပါသည်ကတည်းကတတ်နိုင်သမျှအမှားများမှကာကွယ်ပေးမထားပါ။

အဆိုပါဦးဆောင်၏တန်ဖိုးကပ်တွယ်မှုကိုနှင့်သိုလှောင်မှုတစ်ခုတည်းယူနစ်တူညီသောသတင်းအချက်အလက်များမဟုတ်လို့ပဲ။ format ပြောင်းလဲယူနီကုဒ်ဤပြဿနာကိုရှောင် ဒါဟာရှာဖွေခြင်းနှင့်နှိုင်းယှဉ်မှုအတွက်အားလုံးယူနီကုဒ်ကြောင့်ဇာတ်ကောင်ကုဒ်၏ကွဲပြားခြားနားသောအစိတ်အပိုင်းများ၏တိုက်ဆိုင်မှုမှမှားရလဒ်များကိုပေးခြင်းဘယ်တော့မှကြောင်းသေချာ။ နိယာမ nenalozheniya စောငျ့ရှောကျ coding ဤပုံစံများကိုအခြားအာရှအရှေ့ Multi-byte ကုဒ်ပြောင်းကိရိယာမှသူတို့ကိုခွဲခြားသော။ ဆိုတဲ့အချက်ကို

nonintersection နောက်ထပ်ရှုထောင့် ယူနီကုဒ် encoding တွေက တစ်ခုချင်းစီကိုဇာတ်ကောင်တစ်ဦးကိုရှင်းလင်းစွာသတ်မှတ်နယ်စပ်ရှိကြောင်းဖြစ်ပါတယ်။ ဤသည်ယခင်သင်္ကေတတစ်ခုအစဉျအမွဲအရေအတွက်ကစကင်ဖတ်စစ်ဆေးရန်လိုအပ်ကြောင်းရှင်းလင်းစေပါတယ်။ ဒီ feature တခါတရံ Self-clocking encoding ကဟုခေါ်သည်။ ကုဒ်ယူနစ် Distortion တစ်ဦးတည်းသာဇာတ်ကောင်တစ်ဦးပုံပျက်မိတ်ဆက်ပေးဦးမည်ကို၎င်း, ပတျဝနျးကငျြဇာတ်ကောင်နေဆဲနဂိုအတိုင်းဖြစ်ကြသည်။ 8-bit နဲ့ format ကိုကူးပြောင်းမှာက byte ရန်ညွှန်မှတ်လျှင်, သင်္ကေတများစတင်တွေ့ရှိရန် (binary code ကိုအတွက်) 10xxxxxx နဲ့စတင်ပြီးတဦးတည်းမှသုံးပြောင်းပြန်အသွင်ကူးပြောင်းမှုဘို့လိုအပ်ပါသည်။

ကိုက်ညီမှု

ယူနီကုဒ် Consortium အပြည့်အဝ encoding တွေကအပေါငျးတို့သ 3 ပုံစံများကိုထောက်ခံပါသည်။ အဆိုပါယူနီကုဒ်ဇာတ်ကောင်-encoding ကစံ၏ဂျ၏ညီတူညီမျှခိုင်လုံသောပုံစံများ - ဒါဟာအားလုံးပြောင်းလဲခြင်းကို formats သကဲ့သို့, UTF-8 နှင့်ယူနီကုဒ်ဆန့်ကျင်ဖို့မအရေးကြီးပါသည်။

byte-orientation ကို

UTF-32 ကိုကိုယ်စားပြုဖို့ဇာတ်ကောင်ဟာယူနီကုဒ်ကုဒ်တွေနဲ့တိုက်ဆိုင်သော 32-bit နဲ့ code ကိုယူနစ်, လိုအပ်ပါလိမ့်မယ်။ UTF-16 - နှစ်ခု 16-bit နဲ့ယူနစ်တစ်ခု။ တစ်ဦးက UTF-8 4 bytes အထိအသုံးပြုသည်။

UTF-8 encoding ကက byte-oriented ASCII-based စနစ်များနှင့်သဟဇာတဖြစ်ဖို့ဒီဇိုင်းပြုလုပ်ထားသည်။ အချိန်ကြာမြင့်စွာသတင်းအချက်အလက်နည်းပညာ၏လက်ရှိ software နှင့်အလေ့အကျင့်အများစုဟာ bytes တစ် sequence ကိုအတွက်ဇာတ်ကောင်များ၏ကိုယ်စားပြုမှုအပေါ်မှီခို။ အကွိမျမြားစှာသော protocol များ၏မွဲပေါ်တွင်မူတည်သည် ASCII encoding က နှင့်အထူးထိန်းချုပ်မှုဇာတ်ကောင်ဖြစ်စေအသုံးပြုသည်ကိုရှောင်။ ယူနီကုဒ်စာလုံးများကိုကိုယ်စားပြုများအတွက် 8-bit နဲ့နိုင်တဲ့ coding, မည်သည့်ညီမျှ ASCII ဇာတ်ကောင်တစ်ခုသို့မဟုတ်ထိန်းချုပ်မှုဇာတ်ကောင်သုံးပြီးယူနီကုဒ်နိုင်အခြေအနေများလိုက်လျောညီထွေဖြစ်အောင်လုပ်ဖို့ရိုးရှင်းတဲ့နည်းလမ်းဖြစ်သည်။ ဒီအဆုံး, ထိုသို့ UTF-8 encoding ဖြစ်ပါတယ်။

variable ကိုအရှည်

UTF-8 - 8-bit နဲ့သိုလှောင်မှုယူနစ်ပါဝင်သည်ဟု variable ကိုအရှည်၏နိုင်တဲ့ coding, မည်သည့်တစ်ဦးချင်းစီတဦးချင်းက byte ပိုင်၏ sequence ကို၏အစိတ်အပိုင်းတစ်ခုညွှန်ပြပေးသောအထက် bits သည်။ code ကို sequence ကို၏ပထမဦးဆုံးဒြပ်စင်ရိတ်က္ခာတန်ဖိုးများတစ်ခုမှာအကွာအဝေး, အခြား - လာမယ့်အဘို့။ ဤသည် disjointness encoding ကပေးပါသည်။

ASCII

UTF-8 encoding ကအပြည့်အဝ ASCII ကုဒ်များ (0x00-0x7F) ကိုမပံ့ပိုးသည်။ ဒါဟာယူနီကုဒ်စာလုံးများကို U + သည် 0000-U + သည် 007F တစ်ခုတည်းက byte 0x00-0x7F UTF-8 သို့ကူးပြောင်းနှင့်အရှင် ASCII ကနေချွတ်စွပ်အရွယ်အစားဖြစ်လာကြသည်ကိုဆိုလိုသည်။ ထိုမှတပါး, မရေရာဒွိဟရှောင်ရှားရန်, တန်ဖိုးယူနီကုဒ်အက္ခရာတစ်ခုတည်းက byte ကိုယ်စားပြုမှုအတွက်မဆိုပိုပြီးအသုံးမ 0x00-0x7F ။ သင်္ကေတဝှက်နှစ်ခု bytes တစ် sequence ကိုသုံးပြီး ASCII ထက်အခြား neideograficheskih ။ သင်္ကေတ U + သည် 0800-U + သည် FFFF အထိသုံး bytes ကိုယ်စားပြုနေကြပြီး, U + သည် FFFF ထက်ပိုမိုနှင့်အတူအပိုဆောင်း codes တွေကိုလေး bytes လိုအပ်သည်။

လျှောက်လွှာ၏နယ်ပယ်

UTF-8 encoding ကပုံမှန်အားဖြင့် HTML ကို protocol ကိုအတွက် preference ကိုပေးထား, နှင့်တူသောဖြစ်ပါတယ်။

XML ကို UTF-8 encoding ကအပြည့်အဝထောက်ခံမှုနှင့်အတူပထမဦးဆုံးစံဖြစ်လာသည်။ စံချိန်စံညွှန်းများအဖွဲ့အစည်းများကိုလည်းအကြံပြုပါသည်။ အဆိုပါလုပ်ငန်းစု W3C နဲ့ IETF အင်ဂျင်နီယာအဖွဲ့တစ်ဖွဲ့လူအပေါင်းတို့၏နိုင်တဲ့ coding တခုတခုအပေါ်မှာသဘောတူညီချက်ဆီသို့ရောက် လာ. , အခါ ASCII-ဇာတ်ကောင်ထံမှကွဲပြားခြားနားသော URL ကိုလိပ်စာအတွက်ပံ့ပိုးမှုပြဿနာကိုဖြေရှင်းပြီးခဲ့သည် URL ကိုလိပ်စာများကို သီးသန့် UTF-8 ပါ။

ASCII နှင့်အတူ compatibility သစ်ကိုဆော့ဖျဝဲဖို့အကူးအပြောင်းနိုင်အောင်စီစဉ်ပေးထားတယ်။ အတူ UTF-8 JEdit, Emacs, BBEdit, Eclipse, နှင့် "Notepad" ဟုအဆိုပါ Windows operating system အပါအဝင်အများဆုံးစာသားကိုအယ်ဒီတာများ, အလုပ်လုပ်ပါတယ်။ ယူနီကုဒ်ကုဒ်သွင်း၏အဘယ်သူမျှမကအခြားပုံစံ tool ကို၏ထိုကဲ့သို့သောထောက်ခံမှုဝါကြွားလို့မရပါဘူး။

အားသာချက် coding က bytes တစ် sequence ကိုပါဝင်ပါသည်သောကွောငျ့ဖွစျသညျ။ UTF-8 string ကိုအတူက C နှင့်အခြား programming ကိုဘာသာစကားများအတွက်အလုပ်လုပ်ရန်လွယ်ကူသည်။ ဤသည် encoding က၏တစ်ခုတည်းသောပုံစံဖြစ်ပါသည်, အမိန့်တံဆိပ်များမလိုအပ်ပါဘူး XML ကိုအတွက် BOM သို့မဟုတ် encoding ကကြေငြာ bytes ။

Self-ထပ်တူ

အခြားအ Multi-byte ဇာတ်ကောင်အစုံနှင့်အတူနှိုင်းယှဉ်အပြောင်းအလဲနဲ့၏ 8-bit နဲ့သင်္ကေတကိုအသုံးပြုထားတဲ့ပတ်ဝန်းကျင်မှာတော့ UTF-8 ကိုအောက်ပါအားသာချက်ရှိပါတယ်:

  • ပထမဦးဆုံးက byte code sequence ကိုအလျားအကြောင်းသတင်းအချက်အလက်ပါရှိသည်။ ဒါကတိုက်ရိုက်ရှာဖွေရေး၏ထိရောက်မှုတိုးပွားစေပါသည်။
  • စတင်က byte တန်ဖိုးသတ်မှတ်ထားတဲ့အကွာအဝေးကန့်သတ်ဖြစ်သကဲ့သို့သင်္ကေတ၏အစရှာတွေ့ရိုးရှင်းသော။
  • အဘယ်သူမျှမလမ်းဆုံက byte တန်ဖိုးများ။

အကျိုးကျေးဇူးများနှိုငျးယှဉျ

UTF-8 encoding ကကျစ်လစ်သိပ်သည်းသည်။ သို့သော်အရှေ့အာရှဇာတ်ကောင်ကုဒ်သွင်းအတှကျအသုံးပွုသညျ့အခါ (တရုတ်, ဂျပန်, ကိုးရီးယား, အရိပ်လက္ခဏာကို အသုံးပြု. တရုတ်အရေးအသား) 3-byte ပာကိုအသုံးပြုခဲ့သည်။ ဒါ့အပြင် UTF-8 encoding ကအပြောင်းအလဲနဲ့မြန်နှုန်း coding ၏အခြားပုံစံများကိုယုတ်ညံ့သည်။ လိုင်းများ sorting တစ်ဦးက binary ယူနီကုဒ် sorting အဆိုပါ binary ကဲ့သို့တူညီသောရလဒ်ထုတ်လုပ်သည်။

အဆိုပါ character encoding အစီအစဉ်

အဆိုပါ character encoding အစီအစဉ်တစ်ခုတည်းက byte တည်နေရာကုဒ်ယူနစ်များအတွက် encoding ကသင်္ကေတပုံစံနှငျ့နည်းလမ်းပါဝင်သည်။ အဆိုပါ encoding ကအစီအစဉ်ယူနီကုဒ်စံကိုဆုံးဖြတ်ရန်ကနဦးက byte အမိန့်အမှတ် (BOM, Byte အမိန့်အမှတ်) ၏အသုံးပြုမှုကိုပေးပါသည်။

ဘယ်အချိန်မှာ UTF-8 feature ကို tag ကိုအတွက် BOM သာ coding ၏ပုံစံများ၏အသုံးပြုမှုကိုရည်ညွှန်းခြင်းဖြင့်ကန့်သတ်ထားသည်။ ယင်း၏ encoding ကယူနစ်အရွယ်အစားတဦးတည်းက byte ဖြစ်ပါတယ်အဖြစ် endian UTF-8 အဆုံးအဖြတ်အတွက်ပြဿနာများ, ရှိသည်။ လိုအပ်သောမဟုတ်သလိုအကြံပြုသည်မဟုတ် coding ၏ဤပုံစံများအတွက် BOM အသုံးပြုခြင်း။ BOM UTF-8 encoding ကအတှကျက byte အမိန့်အမှတ်သို့မဟုတ်လက်မှတ်ကိုသုံးပြီးအခြားအ code ကနေပြောင်းလဲရမည့်စာသားအတွက်ဖြစ်ပေါ်စေနိုင်သည်။ 3 bytes EF BB 16 16 BF 16 တစ် sequence ကိုဖြစ်ပါတယ်။

အဆိုပါ UTF-8 encoding ကဘယ်လိုပြင်ဆင်မလဲ

အဆိုပါ coding HTML ကို UTF-8 ကိုအောက်ပါကုဒ်နှင့်အတူထည့်သွင်း:

ဦးခေါင်း

meta http-equiv = "အကြောင်းအရာ-အမျိုးအစား" အကြောင်းအရာ = "စာသားကို / html; charset = UTF-8" ˃

PHP ကို UTF-8 ခုနှစ်တွင် encoding ကက output အဆင့်ကိုတနျဖိုးအမှား setting ပြီးနောက်ဖိုင်ရဲ့အစမှာ () function ကို header ကို အသုံးပြု. သတ်မှတ်:

˂? php

error_reporting (-1);

ခေါင်းစဉ် ( "အကြောင်းအရာ-အမျိုးအစား: စာသားကို / html; charset = UTF-8 ');

တစ်ဦးက MySQL ဒေတာဘေ့စ UTF-8 encoding ကချိတ်ဆက်ရန်သတ်မှတ်:

˂? php

mysql_set_charset ( 'UTF8');

အဆိုပါ CSS ကို-file ကို encoding က UTF-8 ဇာတ်ကောင်ဖြစ်ပါတယ်အောက်ပါအတိုင်းအဖြစ်သတ်မှတ်ပါတယ်:

@charset "UTF-8";

သင်တို့ရှိသမျှသည်အမျိုးအစားဖိုင်တွေကိုကယ်တင်တဲ့အခါမှာ BOM မပါဘဲ UTF-8 encoding ကရှေးခယျြ, မဟုတ်ရင်ဆိုက်အလုပ်လုပ်မည်မဟုတ်ပေ။ UTF-8 ဖို့ encoding ကပြောင်းလဲပစ်ရန် Dreamweaver အတွက်ဒီလိုလုပ်ဖို့မီနူးကို item "ခေါင်းစဉ် / Encoding - - စာမျက်နှာ Properties ကိုပြုပြင်မွမ်းမံ" ကိုရွေးချယ်ဖို့လိုအပ်ပါတယ်။ ဤစာမျက်နှာကိုနောက်တစ်ကြိမ်အားဖြင့်နောက်တော်သို့လိုက်, "Connect ကိုယူနီကုဒ်လက်မှတ် (BOM) »အနေဖြင့်စစ်ဆေးမှုများအမှတ်အသားကိုဖယ်ရှားခြင်းနှင့်အပြောင်းအလဲများသက်ဆိုင်ပါသည်။ စာမျက်နှာပေါ်တွင်သို့မဟုတ် database ထဲတွင်မဆိုစာသားကိုနိုင်တဲ့ coding ၏အခြားပုံစံမိတ်ဆက်ခဲ့သည်ဆိုပါက re-ရိုက်ထည့်ပါသို့မဟုတ် re-အန်ကုက်လုပ်ရန်လိုအပ်ပေသည်။ သငျသညျ regular expressions ကိုအတူအလုပ်လုပ်သောအခါ, အထူးပြုဦးကိုအသုံးပွုဖို့သေချာပါစေ။

သင်တို့သည်လည်း Windows က၏ "Notepad" တွင် UTF-8 encoding ကအတွက် file ကို save နိုင်ပါတယ်။ encoding က၏လိုအပ်သောပုံစံ install နဲ့ UTF-8 အတွက် file ကိုကယ်ဖို့ - မီနူးကို item "Save As ကို ... ဖိုင်မှတ်တမ်း" ကိုရွေးချယ်ခြင်းပြီးနောက်။

စာသားအယ်ဒီတာ Notepad ++ မှာတော့ UTF-8 ထက်အခြားကိုသတ်မှတ်လျှင်, menu ကိုကို item "BOM မပါဘဲ UTF-8 ပြောင်း»ဇာတ်ကောင်ကိုပြောင်းလဲနဲ့ UTF-8 အတွက်ကယ်တင်မှတဆင့်။

အဘယ်သူမျှမကအခြားရွေးချယ်စရာရှိပါတယ်

နိုင်ငံရေးနှင့်ဘာသာစကားနယ်နိမိတ်ဖျက်ထားရာဂလိုဘယ်လိုက်ဇေးရှင်း၏ဆက်စပ်အတွက်ဒေသခံဝိသေသလက္ခဏာများရှိသည်သောဇာတ်ကောင်အစုံ, နည်းနည်းအသုံးပြုမှုဖြစ်ကြသည်။ ယူနီကုဒ်အားလုံးဒေသခံအထောက်အပံ့တစ်ခုတည်းတဲ့ character set ဖြစ်ပါတယ်။ တစ်ဦးက UTF-8 - ဖြစ်သည့်ယူနီကုဒ်၏သင့်လျော်သောအကောင်အထည်ဖော်မှုတစ်ခုဥပမာ:

  • ဒါဟာ ASCII encoding ကနှင့်အတူလိုက်ဖက်မှုအပါအဝင် tools များ၏ကျယ်ပြန့်အကွာအဝေး, ထောက်ခံပါတယ်,
  • ဒါဟာပုံပျက်ဒေတာကိုခံနိုင်ရည်ရှိ၏
  • ရိုးရှင်းပြီးကုသမှုအတွက်ထိရောက်သော;
  • ပလက်ဖောင်းလွတ်လပ်သောဖြစ်ပါတယ်။

encoding ကသို့မဟုတ်တဲ့ character set ၏အဘယ်အရာကိုပုံစံတစ်မျိုးနဲ့ပတ်သက်တဲ့ UTF-8 ဆွေးနွေးငြင်းခုံ၏ထွန်းသည် သာ. ကောင်း၏နှင့်အတူကြောင့်အနတ္တဖြစ်လာသည်။

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 my.birmiss.com. Theme powered by WordPress.