Bug #102683 Proposal for the Japanese 8.0 document correction(Chap 10:Charset).
Submitted: 22 Feb 2021 8:38 Modified: 24 Apr 2021 14:56
Reporter: Kei SAKAI Email Updates:
Status: Closed Impact on me:
None 
Category:MySQL Server: Japanese Documentation Severity:S3 (Non-critical)
Version:8.0 OS:Any
Assigned to: CPU Architecture:Any

[22 Feb 2021 8:38] Kei SAKAI
Description:
https://dev.mysql.com/doc/translation-refman/8.0/ja/charset.html

Although automatic conversion is not in the SQL standard, the standard does say that every character set is (in terms of supported characters) a “subset” of Unicode. 
>♪自動変換は SQL 標準には含まれていませんが、標準では、すべての文字セットが Unicode の 「subset」 であることが示されています。 
---
<♪自動変換は SQL 標準には含まれていませんが、標準では、すべての文字セットが Unicode の 「サブセット」 であることが示されています。 

Every “character” column (that is, a column of type CHAR, VARCHAR, a TEXT type, or any synonym) has a column character set and a column collation. 
>♪すべての 「character」 カラム (CHAR、VARCHAR、TEXT 型またはシノニム型のカラム) には、カラム文字セットおよびカラム照合順序があります。
<♪すべての 「文字型」 カラム (CHAR、VARCHAR、TEXT 型またはシノニム型のカラム) には、カラム文字セットおよびカラム照合順序があります。

The character set and collation are specified for the column, so they are used. 
>カラムに対して文字セットと照合順序が指定されているので、これらが使用されます。
---
<カラムに対して文字セットと照合順序が指定されているため、それらが使用されます。

It tells the parser, “the string that follows uses character set charset_name.” 
>♪パーサーに「「文字セット charset_name を使用する後続の文字列」」を通知します。
---
<♪パーサーに「後続の文字列が文字セット charset_name を使用する」ことを通知します。

Hence, the first two bytes of the string are interpreted as a single sjis character, and the \ is not interpreted as an escape character. 
>したがって、文字列の最初の 2 バイトは、単一の sjis 文字として解釈され、\はエスケープ文字として解釈されません。
<したがって、文字列の最初の 2 バイトは、単一の sjis 文字として解釈され、\はエスケープ文字であるため解釈されません。

The following n (hexadecimal value 6E) is not interpreted as part of an escape sequence. 
>♪次の n (16 進数値 6E) は、エスケープシーケンスの一部として解釈されません。
<♪次の n (16 進数値 6E) は、エスケープシーケンスの一部であるため、解釈されません。
 
 
Duplicate entry 'A\xC3\x9F' for key 1
> Duplicate entry 'A\xC3\x9F' for key 1
---
< Duplicate entry 'A\xCF\x9F' for key 1
(英語ドキュメントからの誤り。英語については #102672 で報告済み)
 

Character Collating Weights
>♪キャラクタ照合ウェイト
---
<♪文字照合の重み
(注:直下の表現と合わせるため)
 
 
ar_JO 	Arabic - Jordan
>♪ar_JO 	♪アラビア語 - Jordan
---
<♪ar_JO 	♪アラビア語 - ヨルダン

es_PR 	Spanish - Puerto Rico
>♪es_PR 	♪スペイン語 - Puerto Rico
---
<♪es_PR 	♪スペイン語 - プエルトリコ

fo_FO 	Faroese - Faroe Islands
>♪fo_FO 	♪Faroese - フェロー諸島
---
<♪fo_FO 	♪フェロー語 - フェロー諸島

mn_MN 	Mongolia - Mongolian
>♪mn_MN 	♪Mongolia - Mongolian
---
<♪mn_MN 	♪モンゴル語 - モンゴル

nb_NO 	Norwegian(Bokmål) - Norway
>♪nb_NO 	♪Norwegian(Bokmål) - ノルウェー
---
<♪nb_NO 	♪ノルウェー語(ブークモール) - ノルウェー

#その他の行についても、言語名に「語」がついていたりついていなかったりするので、統一が望ましいと思います

How to repeat:
see above.
[22 Feb 2021 9:01] MySQL Verification Team
Hello Sakai-san,

Thank you for the report and feedback.

regards,
Umesh
[24 Apr 2021 14:56] Ryusuke Kajiyama
Posted by developer:
 
Fixed in MySQL 8.0 Reference Manual (Japanese) 
https://dev.mysql.com/doc/refman/8.0/ja/charset.html