Intel x86/x86-64アーキテクチャで提供されるRDTSC(Read Time Stamp Counter)命令とRDTSCP(Read Time-Stamp Counter and Processor ID)命令は、そのタイムスタンプカウンタ読取動作に関して何が異なるのでしょうか。

RDTSCでは命令シリアライズが行われずOut-of-Orderプロセッサで不正確な値を読み取るが、後世代で追加されたRDTSCPでは命令シリアライズが強制されるという違いだけでしょうか?
また、RDTSCPで同時に読み取られるIA32_TSC_AUX MSRの使い道も知りたいです。